Sélectionner une page
Formations Data Apache Formation Apache OpenDAL

Formation Apache OpenDAL

Niveau expert
Catégorie Essential
Logo Apache OpenDal
Prix HT / personne
3 jours (21 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

Présentation

Apache OpenDAL est une couche d’accès aux données unifiée pour les environnements cloud-native. Multi-backends, elle permet d’interagir de manière homogène avec les stockages objets, fichiers et services distribués, tout en offrant performance et extensibilité.

Notre formation OpenDAL vous apprendra à abstraire vos accès aux données, sécuriser les échanges et industrialiser vos pipelines ETL/ELT avec une observabilité complète et une maîtrise des coûts.

Vous saurez exploiter les APIs à options pour un contrôle fin, intégrer OpenDAL dans vos chaînes CI/CD et appliquer des patterns d’optimisation adaptés aux charges Data & Big Data.

À l’issue de la formation, vous serez en mesure de bâtir des pipelines cloud-agnostiques, de fiabiliser vos traitements et de publier des runbooks SRE prêts pour la production.

Comme toutes nos formations, celle-ci couvre la dernière version stable et ses nouveautés, avec une approche résolument pratique et opérationnelle.

 

 

Objectifs

  • Maîtriser OpenDAL et ses APIs à options (read/write/list/stat/delete)
  • Concevoir des pipelines ETL/ELT cloud-agnostiques et performants
  • Renforcer sécurité, résilience et observabilité
  • Industrialiser via CI/CD et IaC (Terraform/OpenTofu)
  • Optimiser coûts et SLO grâce aux bons patterns

 

Public visé

  • Cloud Engineers
  • Data Engineers & équipes Big Data
  • Plateformes données, SRE/DevOps

 

Pré-requis

  • Bases cloud (AWS/GCP/Azure) et stockage objet
  • Notions de programmation (Rust/Go/Python/Java)
  • Connaissances CI/CD et Terraform recommandées

Programme de notre formation Apache OpenDAL

[Jour 1 – Matin]

Fondamentaux & prise en main

  • Comprendre Apache OpenDAL : couche d’accès aux données unifiée multi-stockages
  • Principes clés : Open Community, Solid Foundation, Fast Access, Extensible Architecture
  • Panorama des backends : S3, GCS, Azure Blob, HDFS, POSIX
  • Modèle opérateur / services / couches et gestion des capabilities
  • Cas d’usage Data & Cloud-native : ingestion, ETL/ELT, feature store, serverless
  • Atelier pratique : projet OpenDAL & oli, liste/lecture d’objets S3 via credentials temporaires.

 

[Jour 1 – Après-midi]

APIs & options : manipuler les données proprement

  • API read/write/list/stat/delete et Options-based API (ReadOptions, WriteOptions…)
  • Gestion des métadonnées, ranges, multipart et streaming
  • Stratégies de résilience : retries, backoff, idempotence
  • Multi-langages : Rust, Go, Python, Java (bindings)
  • Bonnes pratiques de nommage et préfixes pour data lakes
  • Atelier pratique : lecture/écriture streaming et usage d’options (range, type, checksum).

 

Sécurité & conformité

  • Auth : SigV4, Service Accounts, SAS, OIDC
  • Chiffrement TLS et au repos, politiques de sécurité fournisseurs
  • Gestion des secrets & variables, intégration Vault/KMS
  • Cloisonnement comptes/projets et gouvernance
  • Journaux & audits des accès
  • Atelier pratique : S3 + KMS, rôles assumés, vérification des traces d’audit.

 

[Jour 2 – Matin]

Performance, fiabilité & industrialisation

  • Comprendre latence & throughput ; range requests
  • Multipart upload, pipelining, batching, concurrence
  • Patterns cache-aside, write-through, read-through
  • Tiering & lifecycle ; classes de stockage
  • Observabilité : métriques, logs, traces ; bench avec oli
  • Atelier pratique : bench multi-régions + tableaux de bord Prometheus/Grafana.

 

[Jour 2 – Après-midi]

Robustesse : erreurs réelles & tests

  • Erreurs réseau, throttling et cas S3 200 + erreur
  • Timeouts, circuit-breaker, limiteurs de débit
  • Tests de charge et de chaos
  • Contracts & golden files
  • Politiques de retries par opération
  • Atelier pratique : simuler throttling, régler retries/backoff, valider des SLO.

 

CI/CD & IaC

  • Provision Terraform/OpenTofu, secrets CI
  • Gabarits 12-Factor : config, blue/green, canary
  • Packaging Rust/Go/Python/Java
  • Scans sécu & policy as code
  • Promotion multi-environnements
  • Atelier pratique : pipeline CI provisioning + tests end-to-end OpenDAL.

 

[Jour 3 – Matin]

Intégration avancée & opérations

  • POSIX-like vs object store ; implications parquet/csv/json
  • Écosystème Arrow/Polars/Pandas + OpenDAL
  • Liens pré-signés, staging, atomic move
  • Stratégies multi-cloud/hybride et fallback
  • Data contracts & catalogues
  • Atelier pratique : mini-pipeline ELT cloud-agnostique avec OpenDAL.

 

[Jour 3 – Après-midi]

Exploitation & SRE

  • Runbook incidents et opérations
  • Tableau de bord latence/erreurs/débit
  • Alerting : p95, erreurs classées par backend
  • Budgets d’erreur, SLO/SLI batch vs interactif
  • Optimisation des coûts (listings, small files, multipart)
  • Atelier pratique : runbook + SLO & tests d’alerte.

 

Mise en production & roadmap équipe

  • Checklist sécurité, observabilité, performance, limites
  • Versioning & compatibilité ; suivi des releases
  • Gouvernance préfixes, séparation environnements
  • Documentation : guides dev & exploitation
  • Plan d’adoption et gestion des risques
  • Atelier pratique : revue finale + post-mortem simulé.

Pour aller plus loin

Formation MS-SQL Server

Formation SQL : Les fondamentaux

Formation MySQL

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix HT / personne
3 jours (21 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 2500€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp