Formations Data Data Scientist Formation Polars dataframe

Formation Polars dataframe

formation Polars
Prix 2290€ HT / personne
Durée 3 jours (21 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

Présentation

Notre formation Polars dataframe vous permettra de tirer le maximum de Polars, la librairie Open source pour le traitement des données. Si les pipelines de données rencontrent souvent des problèmes lors du traitement de Big Data avec Python, Polars permet d’ouvrir la voie au traitement de grands ensembles de données grâce à ses structures très performantes.

Notre programme vous permettra d’installer Polars sur votre système et à le configurer selon vos besoins précis. Vous apprendrez à travailler avec des fichiers CSV et Parquet ainsi que les techniques de manipulation de données dans Polars (filtrage, sélection, tri, etc.).

Notre formation couvre également l’utilisation du Lazy mode ainsi que l’interopérabilité avec la conversion vers et depuis Pandas & Numpy. Vous apprendrez également la lecture de fichiers CVS et JSON.

Comme toutes nos formations, elle se déroulera sur la dernière version de l’outil : Polars 0.20.23

 

Objectifs

  • Manipuler de grands ensembles de données avec Polars
  • Analyser ses ensembles de données avec les expressions
  • Utiliser le Lazy mode

 

Public visé

  • Data scientists
  • Data analysts

 

Pré-requis

  • Maitrise de Python

PROGRAMME DE NOTRE FORMATION POLARS DATAFRAME

 

INTRODUCTION À POLARS

  • Qu’est-ce que Polars ?
  • Différences avec Pandas
  • Utiliser Polars pour l’analyse de données 
  • Aperçu de la performance et de la syntaxe expressive de Polars
  • Structure des DataFrames et des Series dans Polars
  • Présentation du mode Lazy Evaluation

 

INSTALLATION ET CONFIGURATION DE L’ENVIRONNEMENT

  • Installer Polars sur différents systèmes d’exploitation
  • Configuration de l’environnement de développement
  • Vérification de l’installation et résolution des problèmes courants
  • Préparation de l’espace de travail pour les exercices pratiques

 

STRUCTURES DE DONNÉES DE BASE DANS POLARS

  • Explication détaillée des Series
  • Comprendre les DataFrames et leurs avantages
  • Création et manipulation basique des Series et DataFrames
  • Conversion entre Polars et Pandas/Numpy pour une interopérabilité

 

MANIPULATION DE DONNÉES AVEC POLARS

  • Importation et exportation de données avec des fichiers CSV et Parquet
  • Techniques de sélection, de filtrage et de tri des données
  • Ajout et transformation de colonnes dans un DataFrame
  • Gestion des valeurs manquantes et des types de données

 

LAZY MODE

  • Introduction au Lazy mode et ses avantages
  • Construction de requêtes
  • Optimisation des performances avec l’évaluation paresseuse
  • Exemples pratiques d’utilisation

 

STATISTIQUES ET AGRÉGATIONS

  • Utilisation des fonctions statistiques de base
  • Techniques de comptage et de résumé des valeurs
  • Group By et agrégations, y compris avec des expressions complexes
  • Agrégation en mode Lazy et optimisations associées

 

OPÉRATIONS SUR LES GROUPES ET JOINTURES

  • Pivot, melt et autres transformations de groupes
  • Concaténation et jointures (inner, left, fast-track) de DataFrames
  • Filtrage avancé en utilisant les conditions et jointures

 

TRAVAILLER AVEC LES DONNÉES TEMPORELLES

  • Introduction aux types de données temporelles et gestion des fuseaux horaires
  • Manipulation et analyse des données temporelles
  • Group by dynamique pour l’analyse de séries temporelles

 

LECTURE ET ÉCRITURE DE FICHIERS DE DONNÉES

  • Lecture et écriture de divers formats de fichiers (CSV, Excel, JSON, Parquet)
  • Techniques de traitement des jeux de données plus grands que la mémoire
  • Lecture de données depuis des bases de données

 

CONCLUSION ET MEILLEURES PRATIQUES

  • Récapitulation des concepts clés de la formation
  • Discussion sur les raisons de choisir Polars par rapport à d’autres outils
  • Échange sur les cas d’usage avancés et l’intégration avec d’autres bibliothèques
  • Conseils pour continuer à apprendre et à s’améliorer après la formation

Pour aller plus loin

 

Formation Python

Formation Python pour les scientifiques

Formation Python analyse de données

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix 2290€ HT / personne
Durée 3 jours (21 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp