Formation Small Language Models avec Hugging Face et Ollama
| 1 400€ HT / personne |
| 2 jours (14 heures) |
Présentation
Small Language Models désigne des modèles de langage compacts capables de traiter des tâches ciblées avec moins de ressources qu’un grand LLM généraliste. Associés à Hugging Face et Ollama, ils permettent de créer des assistants IA plus rapides, plus privés, plus sobres et plus économiques.
Notre formation Small Language Models avec Hugging Face et Ollama vous permettra de sélectionner, exécuter, personnaliser et intégrer des modèles de langage compacts dans des cas d’usage concrets d’entreprise.
Vous apprendrez à explorer le Hugging Face Hub, lire les model cards, comparer plusieurs modèles, analyser les licences, les résultats d’évaluation et les contraintes de déploiement local ou privé.
À l’issue de la formation, vous serez en mesure d’exécuter des modèles avec Ollama, de créer un assistant spécialisé avec un Modelfile, de connecter un SLM à une application et de mettre en place un premier RAG frugal sur des documents internes.
Cette formation aborde également l’évaluation des réponses, la sécurité, la gestion des données sensibles, la documentation du choix de modèle et les bonnes pratiques d’industrialisation pour un usage professionnel des SLM.
Comme toutes nos formations, celle-ci vous présentera la dernière version stable de la technologie et ses nouveautés.
Objectifs
- Comprendre les usages, bénéfices et limites des Small Language Models
- Sélectionner et comparer des SLM sur Hugging Face Hub
- Exécuter et personnaliser des modèles localement avec Ollama
- Créer une application connectée à un modèle local via l’API Ollama
- Construire un RAG frugal avec documents internes, embeddings et SLM
- Évaluer, sécuriser et industrialiser l’usage des SLM en entreprise
Public visé
- Développeurs et tech leads
- Ingénieurs IA et ML engineers
- Data scientists et MLOps engineers
- Architectes IA et architectes cloud
- Équipes innovation souhaitant déployer des modèles IA locaux ou privés
Pré-requis
- Connaissances générales en IA générative ou modèles de langage
- Notions de Python, JavaScript ou TypeScript appréciées
- Compréhension de base des APIs, fichiers JSON et environnements de développement
Pré-requis techniques
- Disposer d’un ordinateur avec Linux, macOS ou Windows avec WSL2
- Créer un compte Hugging Face pour accéder aux modèles, datasets et espaces privés
- Prévoir une connexion Internet stable pour télécharger les modèles et dépendances
Notre programme de formation Small Language Models avec Hugging Face et Ollama
[Jour 1 – Matin]
Comprendre les Small Language Models et leurs cas d’usage
- Comprendre ce qu’est un Small Language Model et le différencier d’un LLM généraliste
- Identifier les bénéfices des SLM : latence réduite, coûts d’inférence maîtrisés, confidentialité et déploiement local
- Comprendre les cas d’usage adaptés : classification, extraction, résumé, assistant métier, chatbot interne et automatisation documentaire
- Identifier les limites des modèles compacts : raisonnement complexe, contexte long, hallucinations, robustesse et spécialisation métier
- Positionner les SLM dans une architecture d’entreprise : poste local, serveur interne, edge, cloud privé ou API applicative
- Atelier pratique : identifier les cas d’usage d’entreprise pertinents pour un SLM et définir les critères de choix du modèle
[Jour 1 – Après-midi]
Sélectionner un modèle avec Hugging Face
- Utiliser Hugging Face Hub pour rechercher des modèles de langage compacts adaptés à un besoin métier
- Lire une model card : usages prévus, limites, licence, données d’entraînement, évaluation et contraintes de déploiement
- Comparer les familles de modèles : Phi, Gemma, Qwen, Llama, Mistral, SmolLM et modèles instruct
- Analyser les critères de sélection : taille, licence, langue, contexte, format, performance, ressources et compatibilité locale
- Exploiter les benchmarks, leaderboards et métriques publiées pour comparer plusieurs modèles candidats
- Atelier pratique : sélectionner plusieurs modèles sur Hugging Face et construire une grille comparative pour un cas métier
Exécuter et personnaliser un SLM avec Ollama
- Installer et configurer Ollama sur un poste local ou un serveur de test
- Télécharger, lancer et tester un modèle compatible avec la CLI Ollama
- Utiliser les principales commandes : pull, run, list, show, remove et serve
- Comprendre les paramètres d’inférence : température, top_p, contexte, seed, répétition et nombre de tokens
- Créer un assistant spécialisé avec un Modelfile, un prompt système et des paramètres adaptés
- Atelier pratique : lancer un SLM avec Ollama, créer un assistant métier local avec Modelfile et tester plusieurs stratégies de prompt
[Jour 2 – Matin]
Intégrer un SLM dans une application d’entreprise
- Utiliser l’API locale d’Ollama pour connecter un SLM à une application Python, JavaScript ou TypeScript
- Créer une API interne pour exposer un modèle local à une application métier
- Gérer les sessions, prompts, paramètres, erreurs, timeouts et réponses structurées
- Mettre en place des formats de sortie exploitables : JSON, résumé structuré, classification ou extraction d’informations
- Ajouter des garde-fous simples : validation d’entrée, filtrage de sortie, logs, restrictions d’usage et gestion des données sensibles
- Atelier pratique : créer un mini-service applicatif qui interroge un SLM local via l’API Ollama
[Jour 2 – Après-midi]
RAG frugal avec Hugging Face, Ollama et documents internes
- Comprendre le rôle du RAG pour connecter un SLM à des documents d’entreprise
- Concevoir une architecture RAG frugal : ingestion, découpage, embeddings, recherche vectorielle et génération
- Choisir entre modèle local, embeddings locaux, embeddings hébergés et base vectorielle selon les contraintes de confidentialité
- Réduire les coûts et la latence : taille des chunks, nombre de documents récupérés, contexte utile et prompts courts
- Limiter les hallucinations avec grounding, citations, sources et consignes de refus
- Atelier pratique : construire une mini-application RAG locale avec documents internes, embeddings et SLM exécuté via Ollama
Évaluation, sécurité et industrialisation des SLM
- Construire un jeu d’évaluation avec prompts, réponses attendues, cas limites et exemples métier
- Comparer plusieurs SLM selon qualité, latence, consommation mémoire, taille du modèle et coût d’exploitation
- Identifier les risques : hallucinations, biais, données sensibles, réponses non conformes et dépendance aux modèles
- Documenter le choix du modèle : licence, limites, cas d’usage, benchmarks, paramètres et règles d’utilisation
- Définir une architecture cible : poste local, serveur interne, container, API privée, edge ou environnement cloud
- Atelier pratique : concevoir une architecture SLM d’entreprise avec Hugging Face, Ollama, RAG, évaluation, sécurité et supervision
Pour aller plus loin
Formation Pytorch
Formation LangChain
Formation Introduction à l’IA en entreprise
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
| 1 400€ HT / personne |
| 2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS

