Formation Redshift Data Warehousing
€ HT / personne |
3 jours (21 heures) |
Présentation
Maîtrisez Amazon Redshift dans sa dimension experte grâce à cette formation avancée, conçue pour les architectes et ingénieurs data exigeants. Vous apprendrez à exploiter tout le potentiel de l’entrepôt de données Redshift, en optimisant les performances, en industrialisant vos pipelines, et en garantissant sécurité, gouvernance et scalabilité dans des architectures cloud de haut niveau.
La formation commence par un deep dive dans l’architecture MPP de Redshift, les types de nœuds, les mécanismes de distribution, de tri, de compression, et les meilleures pratiques pour booster vos requêtes SQL et exploiter les plans d’exécution.
Vous apprendrez à construire des pipelines d’ingestion efficaces, en combinant COPY, S3, Kinesis, Glue et dbt, tout en appliquant les stratégies de sécurité avancées (IAM, RLS, CLS) et d’audit via les vues système.
L’industrialisation est au cœur du programme : CI/CD avec Terraform, modélisation avec dbt, promotion entre environnements, intégration CloudWatch et diagnostic de performance deviennent vos outils du quotidien.
Comme pour toutes nos formations, celle-ci vous sera présentée avec les toutes dernières actualisations de redshift data
Objectifs
- Comprendre l’architecture avancée de Redshift et ses spécificités MPP, stockage colonne et scaling
- Savoir concevoir, optimiser et auditer des modèles de données performants dans Redshift
- Maîtriser les stratégies d’ingestion de données massives via COPY, Kinesis, Glue ou Spectrum
- Être capable de sécuriser, gouverner et tracer les accès et traitements sur des environnements Redshift critiques
- Savoir industrialiser les déploiements Redshift avec Terraform et automatiser les traitements via dbt et CI/CD
- Comprendre et exploiter Redshift Data Sharing, le mode Lakehouse et les architectures analytiques hybrides multicloud
Public visé
- Data Engineers
- Administrateurs Redshift
Pré-requis
- Maîtriser les fondamentaux du cloud AWS
Programme de la formation Redshift Data Warehousing
Rappels et évolutions avancées de Redshift
- Architecture MPP Redshift : deep dive
- Redshift RA3 vs DS2 : impact sur la performance
- Redshift Spectrum, AQUA, Concurrency Scaling, Data Sharing
- Intégration avec S3, Glue, Athena
Gestion avancée du stockage
- Stockage columnar et compression
- Tri (SORTKEY) et distribution (DISTKEY) optimaux
- Gestion du vacuum et du Analyze
- Monitoring du stockage
Optimisation des performances
- Analyse des plans d’exécution
- Tuning SQL et anti-patterns
- Matérialisation des vues : stratégies et cas d’usage
- Partitionnement logique via UNLOAD/EXTERNAL TABLES
- Atelier pratique : Optimisation d’un cluster existant, refactoring de requêtes lentes
Chargement massif et pipelines de données
- COPY optimisé depuis S3, Kinesis ou Glue
- Gestion des erreurs et de la reprise
- Redshift Streaming Ingestion
- ELT avec Redshift + dbt
Gouvernance, sécurité et accès
- Sécurité au niveau ligne et colonne (RLS/CLS)
- IAM vs authentification native
- Audit avec STL/ SVL / SVV tables
- Intégration avec Lake Formation et AWS KMS
Monitoring, diagnostic et audit
- Utilisation de STL_ALERT_EVENT_LOG, SVL_S3LOG
- Intégration CloudWatch, EventBridge, Lambda
- Audit des connexions, requêtes lentes, contention
- Atelier pratique : Création d’un pipeline d’ingestion sécurisé + dashboards de monitoring
Redshift Data Sharing et architecture multi-cluster
- Redshift Data Sharing entre comptes
- Cas d’usages multi-équipes, multi-environnements
- Sécurité et isolation des datasets
CI/CD et industrialisation
- Déploiement Redshift avec Terraform / CloudFormation
- dbt pour la modélisation, la documentation et les tests
- Versioning, revue de code, promotion entre environnements
Cas d’usage avancés et architecture hybride
- Lakehouse avec Redshift + Iceberg
- Redshift + Apache Hudi / Delta Lake
- Fédérations de requêtes avec sources externes
- Atelier final : Mise en place d’un projet complet Data Lake + Redshift + CI/CD + Monitoring
Pour aller plus loin
Formation Mage
Formation Oracle 23
Formation SQL
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
€ HT / personne |
3 jours (21 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS