Sélectionner une page
Formations Data ETL Formation Google Cloud Dataform

Formation Google Cloud Dataform

formation dataform
Prix 1790€ HT / personne
Durée 2 jours (14 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

Présentation

Depuis son émergence, Dataform s’est imposé comme un pilier dans le domaine de la gestion des données dans le cloud. Cet outil, qui se positionne comme une alternative novatrice, offre aux équipes analytiques la possibilité de créer des pipelines de données efficaces en s’inspirant des meilleures pratiques de l’ingénierie logicielle.

Au cours de cette formation Google Cloud Dataform, vous apprendrez à configurer un environnement de développement spécifique à Dataform, ce qui vous permettra de développer, tester et déployer vos premiers modèles de données.

Vous découvrirez également comment Dataform s’intègre parfaitement dans les architectures de données actuelles et comment il répond aux défis les plus pressants auxquels sont confrontées les entreprises en matière de gestion des données.

À la fin de cette formation, vous maîtriserez les fonctionnalités principales de Dataform. Nous vous présenterons également les dernières avancées de Dataform avec la version Core v2.8.

 

Objectifs

  • Comprendre l’importance de la gestion des données dans les entreprises
  • Configurer un projet Dataform et établir des connexions à des sources de données variées
  • Développer des modèles de données avec SQL
  • Automatiser les workflows de données
  • Collaborer efficacement sur des projets de données

 

Public visé

  • Data Scientists
  • Data Analysts
  • Chefs de projet
  • Ingénieurs de données
  • Business Analysts

 

PRÉ-REQUIS

  • Avoir un compte Google Cloud Platform (GCP) actif
  • Maîtriser les concepts de base de la gestion des données
  • Disposer d’un compte GitHub lié au compte Gmail

PROGRAMME DE NOTRE FORMATION DATAFORM

 

INTRODUCTION À DATAFORM ET GESTION DES DONNÉES

  • Présentation de Dataform et de son rôle dans la gestion des données modernes
  • Importance de la gestion des données dans les entreprises
  • Concepts clés : données, bases de données, entrepôts de données
  • Présentation de l'interface utilisateur de Dataform et de ses composants principaux
  • Création d'un compte et configuration initiale de l'environnement de travail

 

CONFIGURATION DU PROJET DATAFORM

  • Création et configuration d'un fichier de projet dataform.json
  • Établissement de la connexion à des sources de données variées
  • Définition des dépendances entre les tables et les fichiers de modélisation
  • Gestion des environnements de développement, de test et de production
  • Bonnes pratiques pour la structuration de projets de données

 

DÉVELOPPEMENT DE MODÈLES DE DONNÉES AVEC SQL

  • Introduction à la modélisation des données relationnelles : entités, relations, attributs
  • Création de tables, vues et fonctions avec Dataform et SQL
  • Techniques de transformation, de filtrage et d'agrégation des données
  • Exercices pratiques sur des cas d'usage réels
  • Conseils pour l'écriture de code SQL propre et maintenable

 

AUTOMATISATION DES WORKFLOWS DE DONNÉES

  • Présentation des tâches Dataform et de leur configuration
  • Planification et exécution des tâches : déclencheurs et planificateurs
  • Gestion des dépendances et orchestration des workflows
  • Surveillance en temps réel des exécutions de tâches et débogage
  • Exemples pratiques d'automatisation des workflows de données

 

COLLABORATION ET PARTAGE DANS LES PROJETS DE DONNÉES

  • Techniques de collaboration au sein des équipes de données
  • Utilisation des fonctionnalités de révision et de partage de code de Dataform
  • Gestion des accès et des permissions pour sécuriser les projets
  • Mise en place de notifications et de commentaires pour améliorer la communication
  • Stratégies de résolution de conflits et de révisions de code

 

SURVEILLANCE, OPTIMISATION ET DÉPANNAGE

  • Introduction aux principes de surveillance des pipelines de données
  • Techniques d'optimisation des performances des requêtes SQL
  • Utilisation des index, des partitions et des agrégations dans Dataform
  • Stratégies pour détecter et résoudre les problèmes de performance
  • Étude de cas : dépannage d'un workflow de données avec Dataform

 

Pour aller plus loin

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Le(s) Formateur(s)

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix 1790€ HT / personne
Durée 2 jours (14 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp