Durée : 50 minutes
scikit-learn et comparer avec une implémentation manuelle.
scikit-learn est une bibliothèque Python qui offre des outils efficaces pour l'analyse de données et la modélisation statistique. Elle simplifie l'implémentation de nombreux algorithmes de machine learning.
Objectif : Utiliser scikit-learn pour entraîner un modèle de régression linéaire sur un jeu de données simulé et comparer les résultats avec une implémentation manuelle.
LinearRegression pour entraîner le modèle.
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
# Génération d'un jeu de données simulé
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)
# Modèle avec scikit-learn
model = LinearRegression()
model.fit(X, y)
print("Coefficient :", model.coef_)
print("Intercept :", model.intercept_)
# Prédiction et visualisation
X_new = np.array([[0], [2]])
y_predict = model.predict(X_new)
plt.scatter(X, y, color='blue', label="Données")
plt.plot(X_new, y_predict, color='red', linewidth=2, label="Modèle")
plt.xlabel("x")
plt.ylabel("y")
plt.title("Régression linéaire avec scikit-learn")
plt.legend()
plt.show()
scikit-learn est installé (pip install scikit-learn).
L'utilisation de scikit-learn simplifie l'entraînement et la prédiction, tout en offrant des outils de visualisation et d'évaluation intégrés.
scikit-learn (ex. régression logistique, SVM).