Sélectionner une page
Formations Data Analyse de données Formation Python : Analyse de Données

Formation Python : Analyse de Données

Rated 4,8 out of 5
Logo Formation Big Data : Python pour l'analyse de données
Prix 1890€ HT / personne
Durée 3 jours (21 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

Présentation

Python est l’un des langages le plus flexibles et polyvalents. Utilisés dans énormément de domaines, Python est le langage de l’année 2022 selon l’index TIOBE. La simplicité de sa syntaxe simplifie son apprentissage, il s’agit du langage de programmation le plus utilisé en Big Data.

Avec la montée en popularité du Big Data ces dernières années, Python est devenu un langage incontournable. Son écosystème d’API lui permet de traiter des données de différents types (SQL et NoSQL) et de piloter des outils de traitement avancé.

Notre formation Python : analyse de données vous enseignera la résolution de problèmes grâce à l’analyse de données. Vous apprendrez les principes de la modélisation statistique et des outils de traitement. Vous verrez également comment extraire les données d’un fichier et mettre en place un modèle d’apprentissage simple.

À l’issue de cette formation, vous serez capable de manipuler des données statistiques grâce au langage Python. Nous vous présenterons la dernière version du langage Python 3.12.

 

Objectifs

  • Appréhender le principe de la modélisation statistique
  • Maîtriser les outils de traitement et d‘analyse de données pour Python
  • Savoir extraire des données d’un fichier
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation des données
  • Savoir mettre en place un modèle d’apprentissage simple
  • Choisir la classification et la régression en fonction du type de données
  • Optimiser les performances prédictives d’un algorithme
  • Créer des classements et des sélections dans de grands volumes de données

 

Public visé

  • Développeurs en Python
  • Responsables Infocentre
  • Développeurs de logiciels
  • Programmeurs
  • Data Analysts
  • Data Scientists

 

Pré-requis

  • Connaissances de base sur Python
  • Connaissances de base en statistiques

 

Pré-requis logiciel

Les dernières versions d’Anaconda et Python installés.

Programme de notre formation Big Data : Python pour l’Analyse de Données

 

Présentation des librairies

  • Pandas
  • NumPy et SciPy
  • Matplotlib
  • Scikit-Learn
  • Utiliser des fonctions de librairies
  • Gérer les modules et librairies

 

Préparation des données

  • L’importance d’avoir des données intègres et préparées
  • Lire et écrire des fichiers CSV
  • Importer des ensembles de données
  • Nettoyer et préparer les données
  • Formatage des données
  • Construire des pipelines de données

 

Modéliser ses données avec Pandas

  • Manipuler ses données
  • Créer des colonnes
  • Transformer ses colonnes
  • Interrogation, triage et filtrage
  • Regroupement et agrégation pour la synthèse des données
  • Fusionner et joindre des données provenant de plusieurs sources
  • La concaténation
  • Sélectionner des éléments
  • Remplacer des valeurs

 

Visualisation des données avec Pandas

  • Effectuer des comparaisons
  • Créer des graphiques :
    • Histogramme
    • Pie chart
    • Graphique de densité Kernel
    • Graphique hexagonal
    • Scatter chart
    • Line chart
    • Boxplot
  • TP : Trouver des insights à partir de ses visualisations

 

Calcul numérique avec NumPY

  • Passer des listes Python aux tableaux NumPy
  • Travailler avec des tableaux multidimensionnels
  • Opérations sur les arrays, découpage et diffusion
  • Les fonctions d’algèbre linéaire et matricielle
  • Les principales fonctions mathématiques

 

Analyse statistique avec SciPy

  • Les bonnes pratiques pour une analyse de données réussie
  • Les 3 classes statistiques de SciPy
  • Utiliser les fonctions de statistiques descriptives
  • Calculer le z-score et le t-score
  • TP : Analyse de plusieurs dataframes différents

 

Développement des modèles de machine learning

  • Les points forts et les limites du machine learning
  • Choisir ses modèles à l’aide de la visualisation
  • Les fonctions d’optimisation et le preprocessing avec SciPy
  • Les différents modèles d’apprentissage avec SciKit-Learn

 

Régression avec Scikit-learn

  • Régression linéaire simple
  • Régression linéaire multiple
  • La régression logistique
  • La régression polynomiale
  • R-carré et EQM pour évaluer son modèle
  • Prédiction et prise de décision

 

Classification avec Scikit-learn

  • SVM
  • Nearest neighbors
  • Random forest
  • K-Means

 

Algorithmes Data

  • Découvrir des algorithmes destinés à l’analyse de données
  • Mettre en œuvre des algorithmes d’analyse de données
  • Évaluer les performances prédictives

Pour aller plus loin

Formation Python : Programmation Objet

Formation Python Machine Learning  avec Scikit.Learn

Formation TensorFlow

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

Rated 5,0 out of 5
6 décembre 2023

Les + : Préparation des supports de cours.

Qualité du formateur.

Carlos R. de chez BruitParif

Afficher tous les témoignages

Rated 5,0 out of 5
6 décembre 2023

Les + : Préparation des supports de cours.

Qualité du formateur.

Carlos R. de chez BruitParif
Rated 5,0 out of 5
6 décembre 2023

Les + : Mise en pratique

Les – : Beaucoup de choses en peu de temps

Matthieu S. de chez BruitParif
Rated 5,0 out of 5
6 décembre 2023

Je recommande la formation

Pierre J. de chez BruitParif
Rated 5,0 out of 5
6 décembre 2023

Les + : Bonne présentation, rapport théorie/pratique.

Pédagogie de la formatrice.

Les – : Un peu courte, il y a beaucoup d’informations à assimiler en peu de temps

En synthèse : Très sympa les sucreries.

Victor D. de chez BruitParif
Rated 5,0 out of 5
6 décembre 2023

Les + : Pédagogie de la formateure, cours, algorithme et exemples, corrections

Les – : Trop court (manque 1 jours de plus)

Je souhaite suivre : –

Manuel H. de chez BruitParif
Rated 5,0 out of 5
16 novembre 2022

Les + : – Disponibilité de la formatrice

– Écoute de la formatrice

– Le fait que cela soit très technique et pas que théorique

– Très accessible

–> Génial correspond parfaitement à ce que nous attendions :p

Les – : Tout est ok

Je souhaite suivre : Airflow

En synthèse : Je recommande, c’était vraiment parfait ! je n’hésiterais pas à approfondir pour un niveau deux dans quelque temps

Richard F. de chez Liveramp
Rated 5,0 out of 5
16 novembre 2022

Les + : Dynamique avec la pratique et les exercices

Flavie J. de chez Liveramp
Rated 5,0 out of 5
16 novembre 2022

Les + : Le côté pratique, la participation

Formation très dynamique

En synthèse : Merci pour la formation

Ali L. de chez Liveramp
Rated 5,0 out of 5
16 novembre 2022

Les + : Formatrice au top ! Je recommande à 1000%

Les – : Aucun

Walid B. de chez Liveramp
Rated 4,0 out of 5
16 novembre 2022

Je recommande la formation

Rindra R. de chez Liveramp
Rated 4,0 out of 5
16 novembre 2022

Je recommande la formation

Robert P. de chez Liveramp

Noter la formation

Prix 1890€ HT / personne
Durée 3 jours (21 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp