Sélectionner une page
Formations Data ETL Formation Matillion ETL

Formation Matillion ETL

Niveau expert
Catégorie Essential
Logo Matillion ETL
Prix HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

Présentation

Maîtrisez Matillion ETL dans sa globalité grâce à cette formation complète, structurée et résolument orientée pratique. De la prise en main à l’automatisation des pipelines, vous apprendrez à concevoir, orchestrer et optimiser des flux de données modernes, dans un environnement cloud-first, compatible avec Snowflake, Redshift ou BigQuery.

Vous commencerez par découvrir l’architecture de Matillion, les différences entre jobs d’orchestration et de transformation, ainsi que la configuration initiale des projets et des connexions sources. Objectif : poser des bases solides pour le développement de pipelines fiables.

Vous apprendrez ensuite à concevoir des workflows d’intégration complets, en manipulant les composants natifs, les connecteurs cloud, les API externes et les scripts personnalisés, tout en appliquant les bonnes pratiques de performance.

La formation abordera aussi la gestion avancée des variables, l’automatisation via planification ou triggers, ainsi que le monitoring détaillé des exécutions et erreurs. Vous découvrirez comment industrialiser vos jobs avec Git et orchestrateurs externes.

Comme pour toutes nos formations, celle-ci vous sera présentée avec les toutes dernières actualisations de Matillion ETL.

 

Objectifs

  • Comprendre l’architecture de Matillion ETL
  • Savoir déployer, configurer et connecter Matillion ETL à des sources et cibles variées
  • Maîtriser les composants de transformation de Matillion
  • Être capable d’automatiser, superviser et auditer les traitements ETL

 

Public visé

  • Data Engineers
  • Data analytics

 

Pré-requis

  • Maîtrise des fondamentaux SQL
  • notions générales sur les architectures ETL / ELT

Programme de la formation Matillion ETL

 

Introduction à Matillion ETL

  • Objectifs et cas d’usage
  • Architecture et principes de fonctionnement
  • Matillion ETL vs Matillion Data Loader
  • Cloud supporté : AWS, GCP, Azure
  • Présentation des menus
  • Zones de développement

 

Configuration de l’environnement

  • Déploiement de Matillion
  • Lancement via AWS Marketplace, GCP Marketplace, ou Azure
  • Prérequis réseau et sécurité
  • Connexions aux bases de données
  • Création de Data Source
  • Authentification, clés et autorisations
  • Paramètres globaux et projets
  • Configuration de projet
  • Variables globales vs environnementales

 

Création de jobs Orchestration

  • Comprendre le pipeline d’orchestration
  • Orchestration vs Transformation
  • Usage typique d’un job d’orchestration
  • Composants principaux
  • Python Script, Bash Script, If Condition, Iterator
  • Run Orchestration / Run Transformation
  • Gestion des dépendances
  • Chaînage logique des composants
  • Gestion des erreurs

 

Création de jobs Transformation

  • Concepts fondamentaux de transformation
  • Types de composants : Input, Join, Filter, Calculator
  • Chargement, nettoyage, enrichissement
  • Construction de pipelines
  • Design visuel de transformations
  • Utilisation de plusieurs sources
  • Optimisation des performances
  • Partitionnement
  • Pushdown SQL
  • Réduction des étapes inutiles

 

Connecteurs et intégrations

  • Connecteurs natifs
  • API et services cloud : Salesforce, S3, REST API
  • Fichiers plats : CSV, Excel, JSON
  • Utilisation des composants “Query”
  • Redshift Query, Snowflake Query, BigQuery Query
  • Web Services et API externes
  • Appels REST avec OAuth 2.0
  • Traitement JSON/XML en sortie

 

Gestion des données et qualité

  • Data Profiling
  • Statistiques descriptives avec le composant “Data Quality”
  • Prévisualisation de données
  • Gestion des erreurs
  • Filtres de données invalides
  • Logs, notifications, Retry
  • Bonnes pratiques de transformation
  • Validation de schéma
  • Documentation inline et métadonnées

 

Variables, paramètres et réutilisabilité

  • Utilisation des variables
  • Variables de projet vs d’environnement
  • Variables dans les scripts et composants
  • Jobs paramétrables
  • Composants Paramètres
  • Job Template et modularité
  • Réutilisation
  • Common jobs
  • Référence à des transformations existantes

 

 

Planification et automatisation

  • Triggers et planification
  • Matillion Scheduler
  • Intégration avec Airflow, cron externe ou Cloud Scheduler
  • Gestion des événements
  • Déclenchement conditionnel
  • Notifications
  • Orchestration complexe
  • Boucles, splits, parallélisation

 

 

Monitoring, logs et audit

  • Console de monitoring Matillion
  • Logs d’exécution et d’erreur
  • Historique des jobs
  • Intégration avec des outils tiers
  • CloudWatch (AWS), Stackdriver (GCP), Azure Monitor
  • Audit et traçabilité
  • Versioning des jobs
  • Suivi des modifications

 

 Bonnes pratiques et cas d’usage avancés

  • Bonnes pratiques DevOps
  • Git integration
  • CI/CD avec Matillion et Terraform
  • Sécurité
  • Gestion des accès par rôle
  • Cryptage et gestion des credentials
  • Études de cas
  • Cas Snowflake : ingestion depuis S3, transformation, export
  • Cas BigQuery : nettoyage de logs applicatifs
  • Cas multi-sources : fusion et enrichissement de données

Pour aller plus loin

Formation Mage

Formation Oracle 23

Formation SQL

 

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp