Formations Data Analyse de données Formation Python : Analyse de Données

Formation Python : Analyse de Données

Noté 0 sur 5
Logo Formation Big Data : Python pour l'analyse de données
Prix 1890€ HT / personne
Durée 3 jours ( 21 heures )

Paris | à distance | FNE

Il ne reste que quelques places
NewCafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Je ne veux pas me déplacer ? Option classe virtuelle gratuite

Présentation

Python est l’un des langages le plus flexibles et polyvalents. Utilisés dans énormément de domaines, Python est le langage de l’année 2022 selon l’index TIOBE. La simplicité de sa syntaxe simplifie son apprentissage, il s’agit du langage de programmation le plus utilisé en Big Data.

Avec la montée en popularité du Big Data ces dernières années, Python est devenu un langage incontournable. Son écosystème d’API lui permet de traiter des données de différents types (SQL et NoSQL) et de piloter des outils de traitement avancé.

Notre formation Python : analyse de données vous enseignera la résolution de problèmes grâce à l’analyse de données. Vous apprendrez les principes de la modélisation statistique et des outils de traitement. Vous verrez également comment extraire les données d’un fichier et mettre en place un modèle d’apprentissage simple.

À l’issue de cette formation, vous serez capable de manipuler des données statistiques grâce au langage Python. Nous vous présenterons la dernière version du langage Python 3.10.

 

Objectifs

  • Appréhender le principe de la modélisation statistique
  • Maîtriser les outils de traitement et d‘analyse de données pour Python
  • Savoir extraire des données d’un fichier
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation des données
  • Savoir mettre en place un modèle d’apprentissage simple
  • Choisir la classification et la régression en fonction du type de données
  • Optimiser les performances prédictives d’un algorithme
  • Créer des classements et des sélections dans de grands volumes de données

 

Public visé

  • Développeurs en Python
  • Responsables Infocentre
  • Développeurs de logiciels
  • Programmeurs
  • Data Analysts
  • Data Scientists

 

Pré-requis

  • Maîtrise de la programmation Python
  • Connaissances de base en statistiques

Programme de notre formation Big Data : Python pour l’Analyse de Données

 

Présentation des librairies

  • Pandas
  • NumPy et SciPy
  • Matplotlib
  • Scikit-Learn
  • Utiliser des fonctions de librairies
  • Gérer les modules et librairies

 

Préparation des données

  • L’importance d’avoir des données intègres et préparées
  • Lire et écrire des fichiers CSV
  • Importer des ensembles de données
  • Nettoyer et préparer les données
  • Formatage des données
  • Construire des pipelines de données

 

Modéliser ses données avec Pandas

  • Manipuler ses données
  • Créer des colonnes
  • Transformer ses colonnes
  • Interrogation, triage et filtrage
  • Regroupement et agrégation pour la synthèse des données
  • Fusionner et joindre des données provenant de plusieurs sources
  • La concaténation
  • Sélectionner des éléments
  • Remplacer des valeurs

 

Visualisation des données avec Pandas

  • Effectuer des comparaisons
  • Créer des graphiques :
    • Histogramme
    • Pie chart
    • Graphique de densité Kernel
    • Graphique hexagonal
    • Scatter chart
    • Line chart
    • Boxplot
  • TP : Trouver des insights à partir de ses visualisations

 

Calcul numérique avec NumPY

  • Passer des listes Python aux tableaux NumPy
  • Travailler avec des tableaux multidimensionnels
  • Opérations sur les arrays, découpage et diffusion
  • Les fonctions d’algèbre linéaire et matricielle
  • Les principales fonctions mathématiques

 

Analyse statistique avec SciPy

  • Les bonnes pratiques pour une analyse de données réussie
  • Les 3 classes statistiques de SciPy
  • Utiliser les fonctions de statistiques descriptives
  • Calculer le z-score et le t-score
  • TP : Analyse de plusieurs dataframes différents

 

Développement des modèles de machine learning

  • Les points forts et les limites du machine learning
  • Choisir ses modèles à l’aide de la visualisation
  • Les fonctions d’optimisation et le preprocessing avec SciPy
  • Les différents modèles d’apprentissage avec SciKit-Learn

 

Régression avec Scikit-learn

  • Régression linéaire simple
  • Régression linéaire multiple
  • La régression logistique
  • La régression polynomiale
  • R-carré et EQM pour évaluer son modèle
  • Prédiction et prise de décision

 

Classification avec Scikit-learn

  • SVM
  • Nearest neighbors
  • Random forest
  • K-Means

 

Algorithmes Data

  • Découvrir des algorithmes destinés à l’analyse de données
  • Mettre en œuvre des algorithmes d’analyse de données
  • Évaluer les performances prédictives

Pour aller plus loin

Formation Python : Programmation Objet

Formation Python Machine Learning  avec Scikit.Learn

Formation TensorFlow

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

Afficher tous les témoignages

Noter la formation

Prix 1890€ HT / personne
Durée 3 jours ( 21 heures )

Paris | à distance | FNE

Il ne reste que quelques places
NewCafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Je ne veux pas me déplacer ? Option classe virtuelle gratuite

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp