Formation Introduction au Deep Learning et aux réseaux de neurones pour l’ingénieur

0,0 rating
Logo Formation Introduction Deep Learning

2100€

1890€ HT / personne

3 jours (21 heures)

Paris
Il ne reste que quelques places
Disponible aussi en intra-entreprise pour former votre équipe.

Présentation

L’intelligence artificielle, après avoir bouleversé de nombreux domaines scientifiques, a commencé à révolutionner un grand nombre de secteurs économiques (industrie, médecine, communication, etc.). Néanmoins, sa présentation dans les grands médias relève souvent du fantasme, très éloignée de ce que sont réellement les domaines du Machine Learning ou du Deep Learning. L’objet de cette formation est d’apporter à des ingénieurs ayant déjà une maîtrise des outils informatiques (dont une base de programmation logicielle) une introduction au Deep Learning ainsi qu’à ses différents domaines de spécialisation et donc aux principales architectures de réseau existant aujourd’hui.

Si les bases mathématiques sont rappelées pendant le cours, un niveau de mathématique de type BAC+2 est recommandé pour plus de confort. Il est dans l’absolu possible de faire l’impasse sur l’axe mathématique pour ne conserver qu’une vision « système », mais cette approche limitera votre compréhension du sujet.

 

Objectifs

  • Compréhension des principes fondamentaux du Machine & Deep Learning
  • Revue des principaux outils et applications
  • Maîtriser les réseaux convolutionnels et récurrents grâce à des exemples Tensorflow
  • Comprendre les modèles d’attention et transformer ainsi que le reinforcement learning
  • Maîtriser les concepts des modèles génératifs et des approximations de distribution

 

Public visé

Développeurs, Architectes, Big Data Data Analyst / Data Engineer / Data Scientist

 

Pré-requis

  • Connaissance de Python et en mathématique

 

Pour aller plus loin

Programme de notre formation Introduction au Deep Learning et aux réseaux de neurones pour l’ingénieur

 

[JOUR 1]

 

1. Introduction IA, Machine Learning & Deep Learning

  • Le fantasme de l’intelligence artificielle face aux réalités d’aujourd’hui.
  • Disparition des algorithmes, nouvelle modélisation des problèmes.
  • Machine learning : présentation de l’apprentissage
  • Approches principales : supervised learning, unsupervised learning, reinforcement learning, self supervised learning.
  • Actions principales : classification, régression, clustering, estimation de densité, réduction de dimensionnalité, prédiction, génération
  • Algorithmes à évolution : introduction et état actuel
  • Exemples d’algorithmes Machine Learning : Régression linéaire, Naive Bayes, Random Tree.

 

2. Concepts fondamentaux d’un réseau de neurones (Application : multi-layer perceptron)

  • Rappel de bases mathématiques.
  • Définition d’un réseau de neurones : architecture classique, fonctions d’activation et de pondération des activations précédentes, profondeur d’un réseau.
  • Définition de l’apprentissage d’un réseau de neurones : fonctions de coût, backpropagation,stochastic gradient descent, maximum likelihood.
  • Modélisation d’un réseau de neurones : modélisation des données d’entrée et de sortie selon le type de problème (régression, classification…). Curse of dimensionality. Distinction entre donnée multi-features et signal. Choix d’une fonction
  • de coût selon la donnée.
  • Approximer une distribution par un réseau de neurones : présentation et exemples
  • Data Augmentation : comment équilibrer un data set et identifier les biais issus de la donnée.
  • Généralisation des résultats d’un réseau de neurones.
  • Initialisations et régularisations d’un réseau de neurones : L1/L2 régularization, Batch Normalization, Instance Normalization
  • Optimisations et algorithmes de convergence : stochastic gradient descent, batching, Adagrad, AdaDelta, RMSProp,

 

3. Outils usuels ML / DL

  • Outils de gestion de donnée : Apache Spark, Apache Hadoop
  • Outils Machine Learning usuel : Numpy, Scipy, Sci-kit
  • Frameworks DL haut niveau : PyTorch, Tensorflow, Caffe

 

4. Applications du Deep Learning : revue des états de l’art et exemples d’applications

  • Classification de données
    • Comprendre ce qu’est la classification de données dans différents scénarios : donnée brute, image, son, texte, etc.
    • Comprendre les enjeux d’une classification de données et les choix impliqués par un modèle de classification.
    • Présentation des outils usuels de classification et notamment des réseaux de type MLP (Multilayer perceptron) ou CNN (Convolutional neural network) VS outils de Machine Learnig (Random Forest, Naive bayes)
    • Présentation d’exemples de solutions existantes (par exemple : classification d’images médicales, d’historique client, de textes rédigés par des utilisateurs, etc.)
    • Clustering : cas particulier d’apprentissage non supervisé. Présentation des différents algorithmes (k-means, Random Forests, etc.)
    • Détection d’anomalies : outils et limites
  • Prédiction d’information et donnée séquentielle/temporelle
    • Enjeux et limite d’une prédiction d’information. Recherche de règles structurelles au sein de la donnée pouvant permettre une logique de prédiction.
    • La prédiction comme une classification ou une régression.
    • Pièges usuels d’une approche prédictive.
    • Présentation des outils usuels de prédiction : RNN (Recurrent Neural Networks), LSTM (Long Short Term Memory).
    • Exemples : prévision des images suivant une séquence vidéo. Prédiction de pollution atmosphérique en milieu urbain, ou autres.
  • Transformation / Génération de données
    • Qu’est-ce que transformer une donnée exactement ? Quelles barrières, quels enjeux.
    • Opération de réinterprétation d’une même donnée : dé-bruitage, génération de résumés textuels, segmentation d’image.
    • Opération de transformation sur un même format : traduction de texte d’une langue à une autre (présentation sommaire de l’architecture Google Machine Translation ou BERT par Google).
    • Opération de génération de donnée « originale » : neural Style, superrésolution, génération d’images à partir de présentations textuelles.
  • Reinforcement Learning : contrôle d’un environnement
    • Présentation du Deep Reinforcement Learning.
    • Applications : contrôle de simulations numériques, voiture automatique, robotique.

 

[JOUR 2]

 

5. Convolutional Neural Networks (CNN).

  • Présentation des CNNs : principes fondamentaux et applications.
  • Fonctionnement fondamental d’un CNN : couche convolutionnelle, utilisation d’un kernel, padding & stride, génération de feature maps, couches de type ‘pooling’. Extensions 1D, 2D et 3D.
  • Présentation des différentes architectures CNN ayant porté l’état de l’art en classification d’images : LeNet, VGG Networks, Network in Network, Inception, Resnet. Présentation des innovations apportées par chaque architecture et leurs
  • applications plus globales (Convolution 1×1 ou connexions résiduelles).
  • Utilisation d’un modèle d’attention.
  • Application à un cas de figure de classification usuel (texte ou image).
  • U Networks pour la génération ou la segmentation multi-classes.
  • Exploitation des représentations internes d’un CNN pour un apprentissage secondaire non supervisé.

 

6. Recurrent Neural Networks (RNN).

  • Présentation des RNNs : principes fondamentaux et applications.
  • Fonctionnement fondamental du RNN : hidden activation, back propagation through time, unfolded version.
  • Évolutions vers les GRU (Gated Recurrent Units) et LSTM (Long Short Term Memory). Présentation des différents états et des évolutions apportées par ces architectures.
  • Problèmes de convergence et vanising gradient.
  • Types d’architectures classiques : Prédiction d’une série temporelle, classification…
  • Architecture de type RNN Encoder Decoder.
  • Applications NLP : word/character encoding, traduction.
  • Applications Vidéo : prédiction de la prochaine image générée d’une séquence vidéo.

 

7. Modèles d’attentions, CNN vs RNN

  • Définition d’un modèle d’attention fondamental en analyse d’une image, approche Deep Reinforcement Learning.
  • Modèle d’attention en amont d’un CNN pour ciblage d’une zone particulière.
  • CNN Sequence to sequence avec un modèle d’attention, détail d’architecture.
  • Attention dans une architecture RNN Encoder-decoder.
  • Modèle d’attention « Attention is all you need », état de l’art, Cellule transformer.

 

8. Debugging / analyse du fonctionnement d’un réseau

  • État actuel de la compréhension mathématique de la convergence en Deep Learning.
  • Analyse de neurones « morts » ou de kernels fondamentaux d’un CNN.
  • GradCam et Saliency maps.
  • Analyse d’un modèle d’attention.
  • Hierarchical Contextual Decompositions.

 

[JOUR 3]

 

9. Modèles générationnels : Variational AutoEncoder (VAE) et Generative Adversarial Networks (GAN)

  • Présentation des modèles génératifs, lien avec les CNNs/RNNs.
  • Auto-encoder : réduction de dimensionnalité et génération d’une version compressée. Limites, mode collapse.
  • Variational Auto-encoder : modèle générationnel et approximation de la distribution d’une donnée. Définition et utilisation de l’espace latent. Reparameterization trick. Applications et limites observées.
  • Generative Adversarial Networks : principes fondamentaux. Architecture à deux réseaux (générateur et discriminateur) avec apprentissage alterné, fonctions de coût disponibles.
  • Convergence d’un GAN et difficultés rencontrées.
  • Convergence améliorée : Wasserstein GAN, Earth Moving Distance.
  • CycleGAN, progressive growing GANs, BigGAN.
  • Applications de génération d’images ou de photographies, génération de texte, superrésolution.

 

10. Deep Reinforcement Learning.

  • Présentation du reinforcement learning : contrôle d’un agent dans un environnement défini par un état et des actions possibles.
  • Approche fondamentale : Markov decision process, Q-Learning VS Policy Gradient, Monte Carlo, SARSA, TD Learning.
  • Deep Q Learning : experience replay, et application au contrôle d’un jeu vidéo. Double Q Learning & Dueling Q Networks. Rainbow.
  • Policy gradients. On-policy && off-policy. Actor critic architecture et approche asynchrone A3C.
  • Proximal Policy Optimization (OpenAI).
  • Encouragement de l’exploration par un paramètre d’entropie.
  • World models, imagination augmented agents.
  • Présentation AlphaGo et AlphaGo Zero.
Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Nos Formateurs Référents

Eric

Eric

Ingénieur Telecom ParisTech et chef d’entreprise depuis 2010. Il est co-fondateur de Quematech, société de conseil et services en architecture logicielle complexe, ainsi que de Datalchemy, startup spécialisée en Deep Learning, chez qui il occupe également le poste de Lead Data Scientist.

Témoignages

Il n'y a pas encore de commentaires. Soyez le premier à en écrire un dans la section noter la formation !

Afficher tous les témoignages

Il n'y a pas encore de commentaires. Soyez le premier à en écrire un dans la section noter la formation !

Noter la formation

2100€

1890€ HT / personne

3 jours (21 heures)

Paris
Il ne reste que quelques places
Disponible aussi en intra-entreprise pour former votre équipe.

Une question ? Un projet ?

Pour des informations complémentaires, n’hésitez pas à nous contacter.