Sélectionner une page
Formations Data Analyse de données Formation Introduction au Machine Learning avec Scikit-learn

Formation Introduction au Machine Learning avec Scikit-learn

Niveau confirmé
Catégorie Essential
Logo Formation Scikit-learn - Python Machine Learning
Prix 1 490€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et encas offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

Présentation

Scikit-learn est la bibliothèque de référence pour le Machine Learning en Python, offrant une interface unifiée pour traiter une grande variété de problèmes de données. Elle permet de transformer des données brutes en modèles prédictifs performants de manière reproductible au sein de l’écosystème scientifique.

Notre formation Introduction au Machine Learning avec Scikit-learn vous permettra de maîtriser l’ensemble de la chaîne de valeur du ML : du nettoyage des données (preprocessing) à l’optimisation des hyperparamètres. Vous apprendrez à évaluer vos modèles avec rigueur pour garantir leur généralisation et à construire des pipelines de calcul industrialisables.

L’approche est 100% pratique, basée sur des ateliers guidés, des démonstrations de construction de modèles et des diagnostics d’erreurs courantes. À l’issue de la formation, vous disposerez de scripts types, de notebooks prêts à l’emploi et d’une check-list de bonnes pratiques pour industrialiser vos futurs projets de Machine Learning. Comme toutes nos formations, celle-ci s’appuie sur la dernière version stable de la technologie et privilégie une approche pratique et opérationnelle.

Comme toutes nos formations, celle-ci vous présentera la dernière version stable de la technologie Introduction au Machine Learning avec Scikit-learn (1.7.0) et ses nouveautés.

 

Objectifs

  • Construire des modèles supervisés et non supervisés
  • Évaluer et comparer les modèles
  • Préparer les données pour le ML

 

Public visé

  • Débutants en ML
  • Data scientists juniors

 

Pré-requis

  • Connaissances en Python et statistiques de base

 

Pré-requis techniques

  • Distribution Python : Anaconda ou Miniconda (version 3.9 ou supérieure recommandée)
  • IDE / Éditeur : JupyterLab, VS Code (avec extension Python) ou PyCharm
  • Bibliothèques Python : scikit-learn, pandas, numpy et matplotlib installés via pip ou conda

Programme de notre Formation Introduction au Machine Learning avec Scikit-learn

 

[Jour 1 – Matin]

Fondamentaux et Préparation des données

  • Introduction au Machine Learning : types d’apprentissage (supervisé, non-supervisé), terminologie et écosystème Python
  • Structure de l’API Scikit-learn : Estimators, Transformers et Predictors
  • Nettoyage des données (Preprocessing) : gestion des valeurs manquantes et encodage
  • Mise à l’échelle : Scaling et normalisation
  • Manipulation de la documentation officielle
  • Atelier pratique : Mise en place de l’environnement et pipeline de data cleaning.

 

[Jour 1 – Après-midi]

Apprentissage Supervisé : Classification et Régression

  • Algorithmes de Classification : Arbres de décision et K-Nearest Neighbors (KNN)
  • Introduction aux méthodes d’ensemble : Random Forest
  • Modèles de Régression : linéaire simple, multiple et fonctions de coût
  • Comprendre le Sur-ajustement (Overfitting) et le compromis Biais-Variance
  • Évaluation initiale via le R-squared
  • Atelier pratique : Création d’un classificateur de risques et d’un modèle de prédiction.

 

[Jour 2 – Matin]

Évaluation, Validation et Optimisation

  • Métriques de performance : Précision, Rappel, F1-Score et RMSE
  • Validation du modèle : Découpage Train/Test et Validation croisée
  • Optimisation des hyperparamètres (HPO) : GridSearch et RandomizedSearch
  • Techniques de Régularisation : Lasso et Ridge
  • Sélection des meilleures variables
  • Atelier pratique : Tuning complet d’un modèle pour maximiser ses performances.

 

[Jour 2 – Après-midi]

Apprentissage Non-Supervisé et Approches Avancées

  • L’algorithme K-Means et évaluation par la méthode du coude
  • Réduction de dimension : PCA (Analyse en Composantes Principales)
  • Aperçu des données complexes : Text Mining et images avec Scikit-learn
  • Industrialisation : construction de Pipelines et interopérabilité
  • Stratégies de montée en charge et performance
  • Atelier pratique : Segmentation de clientèle (clustering) et projet final de synthèse.

 

Pour aller plus loin

Formation Python Analyse de données

Formation Python : Programmation Objet

Formation TensorFlow

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

30 juillet 2025

Les + : Réactivité du formateur par rapport aux demandes

Les – : Une documentation un peu plus conséquente et documentée

Guillaume D. de chez Caisse d'Allocations Familiales du Loir et Cher

Afficher tous les témoignages

30 juillet 2025

Les + : Réactivité du formateur par rapport aux demandes

Les – : Une documentation un peu plus conséquente et documentée

Guillaume D. de chez Caisse d'Allocations Familiales du Loir et Cher
30 juillet 2025

Les + : Les nombreux cas pratiques.

Les – : Un peu décousu.

Le formateur semblait parfois prendre connaissance des ressources en direct.

Alexandre P. de chez Caisse d'Allocations Familiales de la Sarthe

Noter la formation

Prix 1 490€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et encas offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp