Formation Introduction au Machine Learning avec Scikit-learn
| 1 490€ HT / personne |
| 2 jours (14 heures) |
Présentation
Scikit-learn est la bibliothèque de référence pour le Machine Learning en Python, offrant une interface unifiée pour traiter une grande variété de problèmes de données. Elle permet de transformer des données brutes en modèles prédictifs performants de manière reproductible au sein de l’écosystème scientifique.
Notre formation Introduction au Machine Learning avec Scikit-learn vous permettra de maîtriser l’ensemble de la chaîne de valeur du ML : du nettoyage des données (preprocessing) à l’optimisation des hyperparamètres. Vous apprendrez à évaluer vos modèles avec rigueur pour garantir leur généralisation et à construire des pipelines de calcul industrialisables.
L’approche est 100% pratique, basée sur des ateliers guidés, des démonstrations de construction de modèles et des diagnostics d’erreurs courantes. À l’issue de la formation, vous disposerez de scripts types, de notebooks prêts à l’emploi et d’une check-list de bonnes pratiques pour industrialiser vos futurs projets de Machine Learning. Comme toutes nos formations, celle-ci s’appuie sur la dernière version stable de la technologie et privilégie une approche pratique et opérationnelle.
Comme toutes nos formations, celle-ci vous présentera la dernière version stable de la technologie Introduction au Machine Learning avec Scikit-learn (1.7.0) et ses nouveautés.
Objectifs
- Construire des modèles supervisés et non supervisés
- Évaluer et comparer les modèles
- Préparer les données pour le ML
Public visé
- Débutants en ML
- Data scientists juniors
Pré-requis
- Connaissances en Python et statistiques de base
Pré-requis techniques
- Distribution Python : Anaconda ou Miniconda (version 3.9 ou supérieure recommandée)
- IDE / Éditeur : JupyterLab, VS Code (avec extension Python) ou PyCharm
- Bibliothèques Python : scikit-learn, pandas, numpy et matplotlib installés via pip ou conda
Programme de notre Formation Introduction au Machine Learning avec Scikit-learn
[Jour 1 – Matin]
Fondamentaux et Préparation des données
- Introduction au Machine Learning : types d’apprentissage (supervisé, non-supervisé), terminologie et écosystème Python
- Structure de l’API Scikit-learn : Estimators, Transformers et Predictors
- Nettoyage des données (Preprocessing) : gestion des valeurs manquantes et encodage
- Mise à l’échelle : Scaling et normalisation
- Manipulation de la documentation officielle
- Atelier pratique : Mise en place de l’environnement et pipeline de data cleaning.
[Jour 1 – Après-midi]
Apprentissage Supervisé : Classification et Régression
- Algorithmes de Classification : Arbres de décision et K-Nearest Neighbors (KNN)
- Introduction aux méthodes d’ensemble : Random Forest
- Modèles de Régression : linéaire simple, multiple et fonctions de coût
- Comprendre le Sur-ajustement (Overfitting) et le compromis Biais-Variance
- Évaluation initiale via le R-squared
- Atelier pratique : Création d’un classificateur de risques et d’un modèle de prédiction.
[Jour 2 – Matin]
Évaluation, Validation et Optimisation
- Métriques de performance : Précision, Rappel, F1-Score et RMSE
- Validation du modèle : Découpage Train/Test et Validation croisée
- Optimisation des hyperparamètres (HPO) : GridSearch et RandomizedSearch
- Techniques de Régularisation : Lasso et Ridge
- Sélection des meilleures variables
- Atelier pratique : Tuning complet d’un modèle pour maximiser ses performances.
[Jour 2 – Après-midi]
Apprentissage Non-Supervisé et Approches Avancées
- L’algorithme K-Means et évaluation par la méthode du coude
- Réduction de dimension : PCA (Analyse en Composantes Principales)
- Aperçu des données complexes : Text Mining et images avec Scikit-learn
- Industrialisation : construction de Pipelines et interopérabilité
- Stratégies de montée en charge et performance
- Atelier pratique : Segmentation de clientèle (clustering) et projet final de synthèse.
Pour aller plus loin
Formation Python Analyse de données
Formation Python : Programmation Objet
Formation TensorFlow
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
Les + : Réactivité du formateur par rapport aux demandes
Les – : Une documentation un peu plus conséquente et documentée
Afficher tous les témoignages
Les + : Réactivité du formateur par rapport aux demandes
Les – : Une documentation un peu plus conséquente et documentée
Les + : Les nombreux cas pratiques.
Les – : Un peu décousu.
Le formateur semblait parfois prendre connaissance des ressources en direct.
Noter la formation
| 1 490€ HT / personne |
| 2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS

