Sélectionner une page
Formations Data Machine Learning Formation XGBoost

Formation XGBoost

Niveau confirmé
Catégorie Essential
Logo XGBoost
Prix HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

Présentation

XGBoost (Extreme Gradient Boosting) est une bibliothèque de machine learning optimisée pour la performance, utilisée pour les tâches de classification et de régression. Elle repose sur le gradient boosting, intégrant des techniques avancées de régularisation, gestion des valeurs manquantes et optimisation parallèle.

Notre formation XGBoost vous permettra de maîtriser la construction de modèles prédictifs robustes et interprétables. Vous découvrirez comment entraîner, optimiser, expliquer et déployer des modèles performants, en utilisant des cas concrets issus du monde réel.

Vous apprendrez à préparer les données, optimiser les hyperparamètres, visualiser les décisions et mettre en production vos modèles avec auditabilité et reproductibilité.

À l’issue de la formation, vous serez en mesure de construire des modèles XGBoost de A à Z, de l’analyse exploratoire à leur intégration dans des systèmes métiers.

Comme toutes nos formations, celle-ci s’appuie sur la dernière version stable de XGBoost v3.0.3 et privilégie une approche résolument pratique et opérationnelle.

 

Objectifs

  • Comprendre le fonctionnement du gradient boosting et d’XGBoost
  • Construire des modèles de classification et de régression
  • Optimiser les performances avec des techniques de tuning avancé
  • Interpréter et documenter les résultats modèles
  • Déployer un modèle XGBoost et assurer sa traçabilité

 

Public visé

  • Data Scientists
  • Data Analysts
  • Ingénieurs Machine Learning
  • Statisticiens

 

Pré-requis

  • Maîtrise des bases Python, Pandas et scikit-learn
  • Connaissances fondamentales en machine learning supervisé
  • Notions en statistiques et analyse de données tabulaires

 

Notre formation XGBoost

 

Comprendre les fondements du boosting et d’XGBoost

  • Introduction au machine learning supervisé et aux modèles d’ensemble
  • Principe du boosting et de la combinaison de modèles faibles
  • Comparaison entre bagging, random forest et boosting
  • Architecture et spécificités de XGBoost (régularisation, split finding, etc.)
  • Configuration de l’environnement Python pour XGBoost
  • Atelier : Implémenter un modèle de boosting simple avec scikit-learn et XGBoost

 

Préparation des données et optimisation du pipeline

  • Gestion des données tabulaires et encodage des variables
  • Traitement des valeurs manquantes et outliers
  • Utilisation des matrices DMatrix pour un entraînement optimisé
  • Séparation train/test et validation croisée
  • Bonnes pratiques de preprocessing pour le boosting
  • Atelier : Construction d’un pipeline de préparation des données avec Pandas et XGBoost

 

Entraîner un modèle de classification avec XGBoost

  • Définition des hyperparamètres principaux
  • Métriques d’évaluation : accuracy, logloss, AUC
  • Importance des variables et analyse des splits
  • Early stopping, régularisation L1/L2 et gestion du surapprentissage
  • Visualisation des arbres et interprétabilité locale
  • Atelier : Modéliser un problème de churn client ou crédit scoring avec XGBoost

 

Optimisation des performances et tuning avancé

  • Utilisation de GridSearchCV, RandomizedSearchCV et Optuna
  • Analyse des courbes de validation et choix des meilleurs paramètres
  • Gestion de l’équilibre classe dans des datasets déséquilibrés
  • Stratégies d’ensemble avec XGBoost (bagging + boosting)
  • Bonnes pratiques de reproductibilité et de robustesse
  • Atelier : Tuning de modèle XGBoost pour un dataset public

 

Régression et cas d’usage métiers de XGBoost

  • Adapter XGBoost à des problèmes de régression
  • Études de cas : prévision de prix, estimation de vente, séries temporelles simples
  • Comparaison avec d’autres modèles (linear, RF, LGBM)
  • Choix des objectifs et gestion des métriques spécifiques (RMSE, MAE)
  • Interpréter les résultats métiers et reporting
  • Atelier : Prévision de prix immobiliers ou volume de ventes avec XGBoost

 

Déploiement, audit et mise en production

  • Sauvegarde et chargement de modèles avec joblib ou pickle
  • Déploiement via API REST (Flask ou FastAPI)
  • Explicabilité : SHAP, LIME, importance globale vs locale
  • Suivi des performances en production
  • Contrôles qualité, documentation, auditabilité du modèle
  • Atelier : Mise en production d’un modèle XGBoost avec interprétabilité intégrée

Pour aller plus loin

Formation Pyhton : Programmation objet

Formation LangChain : Framework LLM

Formation ChatGPT : L’IA pour la création de contenu

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Nos Formateurs Référents

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp