Sélectionner une page
Formations IA Ingénieur IA Formation DSPy : maitriser les coûts des LLms

Formation DSPy : maitriser les coûts des LLms

Niveau confirmé
Catégorie Essential
Formation DSPy
Prix 2 290€ HT / personne
3 jours (21 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et encas offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

Présentation

DSPy permet de concevoir des pipelines LLM plus fiables et moins coûteux en remplaçant le prompt “au feeling” par une approche programmable, mesurable et optimisable. Vous apprendrez à réduire la facture tokens et la latence tout en améliorant la qualité sur des cas d’usage comme RAG, extraction structurée et assistants métier.

La formation se concentre sur la maîtrise des coûts : choix de modèles, stratégies de réduction de contexte, cache, routage, et optimisation automatique des prompts/chaînes via les modules DSPy. Chaque notion est reliée à des métriques concrètes (tokens, temps, taux d’erreur) et à des critères de qualité.

Approche 100% pratique : ateliers guidés, démos reproductibles et mini-projet. Livrables : un repo d’exemples DSPy, une grille d’évaluation, et un pipeline optimisé (baseline vs version optimisée) avec rapport coûts/qualité.

Comme toutes nos formations, celle-ci vous présentera la dernière version stable de la technologie et ses nouveautés.

 

Objectifs

  • Instrumenter et mesurer coûts, latence et qualité d’un pipeline LLM.
  • Construire des modules DSPy (Predict, ChainOfThought, RAG) et les composer.
  • Définir des datasets, métriques et tests de non-régression.
  • Optimiser automatiquement prompts et paramètres avec teleprompting.
  • Mettre en place cache, routage de modèles et réduction de contexte.

 

Public visé

  • Développeurs Python intégrant des LLM en production
  • Data scientists / ML engineers
  • Tech leads et architectes applicatifs
  • Product engineers travaillant sur des assistants/RAG

 

Pré-requis

  • Maîtrise de Python (fonctions, classes, environnements)
  • Notions d’API REST et formats JSON
  • Compréhension de base des LLM (tokens, contexte, température)
  • Notions de Git et ligne de commande

 

Pré-requis techniques

  • Machine avec 16 Go RAM recommandés (8 Go minimum)
  • Windows (WSL2 conseillé), macOS ou Linux
  • Python 3.10+, venv/poetry, et un éditeur (VS Code/PyCharm)
  • Accès à une API LLM (clé fournie par votre organisation) et connexion Internet stable

Programme de notre formation DSPy : maitriser les coûts des LLms

 

[Jour 1 – Matin]

Fondamentaux DSPy et mesure des coûts LLM

  • Comprendre le positionnement de DSPy : programmation déclarative de pipelines LLM et optimisation
  • Identifier les postes de coût : tokens (prompt/completion), latence, taux d’erreur, retries
  • Mettre en place une instrumentation : comptage tokens, durée, coût estimé par requête et par scénario
  • Définir des métriques qualité/coût : exactitude, couverture, hallucinations, coût par succès
  • Atelier pratique : Instrumenter un mini-pipeline DSPy et produire un tableau coût/latence/qualité.

 

[Jour 1 – Après-midi]

Réduire les tokens : signatures, prompts compacts et sorties contraintes

  • Concevoir des Signatures DSPy (inputs/outputs) pour limiter l’ambiguïté et la verbosité
  • Appliquer des stratégies de compression : consignes courtes, exemples minimaux, suppression du bruit
  • Contraindre la sortie : formats stricts (JSON), champs obligatoires, longueur maximale
  • Mettre en place des garde-fous : validation de sortie et relance ciblée plutôt que re-prompt complet
  • Atelier pratique : Refactorer un prompt “long” en signature DSPy + validation, puis mesurer le gain en tokens.

 

[Jour 2 – Matin]

Optimisation DSPy : compilation, téléprompting et choix de modèles

  • Structurer un programme DSPy : modules, chaînage, séparation extraction/raisonnement/rédaction
  • Comprendre la compilation DSPy : objectifs, jeux de données, métriques et contraintes de coût
  • Utiliser le teleprompting pour améliorer la qualité à coût constant (ou réduire le coût à qualité constante)
  • Stratégies de model routing : petit modèle par défaut, escalade vers un modèle plus grand en cas d’échec
  • Atelier pratique : Compiler un module DSPy sur un dataset et comparer coût/qualité avant/après.

 

[Jour 2 – Après-midi]

Réduire les appels : cache, batching et contrôle des retries

  • Mettre en place un cache (clé par signature + paramètres + version) et gérer l’invalidation
  • Réduire les appels via batching et regroupement de requêtes homogènes
  • Limiter les retries : backoff, seuils, classification des erreurs (transitoires vs logiques)
  • Détecter et corriger les boucles coûteuses : relances inutiles, sur-chaînage, prompts redondants
  • Atelier pratique : Ajouter cache + politique de retries et mesurer l’impact sur un flux à forte volumétrie.

 

[Jour 3 – Matin]

Qualité sous contrainte : évaluations, tests et budgets

  • Construire un jeu d’évaluation : cas nominaux, cas limites, données “pièges” et critères d’acceptation
  • Mettre en place des evals automatisées : scoring, seuils, régressions et suivi dans le temps
  • Introduire des budgets : coût max par requête, coût max par session, timeouts et dégradations contrôlées
  • Approche “fail fast” : validations intermédiaires pour arrêter tôt les traitements non conformes
  • Atelier pratique : Créer une suite d’evals + budget de coût et intégrer un contrôle de régression.

 

[Jour 3 – Après-midi]

Mise en production : observabilité, gouvernance et optimisation continue

  • Mettre en place une observabilité opérationnelle : logs structurés, traces, coûts par endpoint et par client
  • Définir des alertes : dérive de coût, hausse de latence, baisse de qualité, hausse de taux d’échec
  • Versionner prompts/signatures/compilations : rollbacks, A/B tests, canary releases
  • Plan d’optimisation continue : revue hebdo des top coûts, priorisation et quick wins
  • Atelier pratique : Déployer un pipeline DSPy “budget-aware” avec dashboard coût/qualité et stratégie de rollback.

 

Pour aller plus loin

Formation Python

Formation MLFlow

Formation MLOps

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix 2 290€ HT / personne
3 jours (21 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et encas offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp