Sélectionner une page
Formations Data ETL Formation Azure Databricks

Formation Azure Databricks

Logo formation azure databricks
Prix 1590€ HT / personne
Durée 2 jours (14 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

Présentation

Azure Databricks est la solution pour manipuler un nombre massif de clusters de base de données. Azure Databricks s’appuie sur la puissance du Cloud de Microsoft pour simplifier votre processus Big Data.

Azure Databricks est une version améliorée d’Apache Spark géré entièrement par Azure. Le système est alors facilement scalable et contrôlable afin de réduire vos coûts durant la phase de développement.

Le système dispose de différents connecteurs comme ADSL, Azure SQL DW ou encore PowerBI. C’est également un outil hautement sécurisé, intégrant le cadre de sécurité Azure Active Directory.

Notre formation Azure Databricks vous enseignera comment utiliser cet outil lors de votre processus ETL. Nous vous présenterons comment extraire, transformer et charger des donnés avec Azure Databricks, nous évoquerons aussi la création de dashboard et de pipelines.

Notre formation Azure Databricks présentera la dernière version de l’outil à savoir, Azure Databricks.

 

Objectifs

  • Bien connaître les spécificités de Azure Databricks
  • Extraire les données avec Azure Databricks
  • Savoir comment transformer et charger ses données
  • Utiliser les dashboards et déployer son processus

 

Public visé

  • Développeurs
  • Data Engineer
  • Architectes
  • Administrateurs système
  • Data miners
  • Data scientists
  • Data analysts
  • Business intelligence analysts
  • Market inteligence analysts

 

Pré-requis

 

Pré-requis logiciel

  • Disposer d’un compte Azure
  • Disposer d’un compte Databricks

Programme de la formation Azure Databricks

 

INTRODUCTION

  • Présentation de Databricks
  • Les bénéfices de l’outil
  • Databricks vs Apache Spark
  • Présentation de l’interface
  • Créer son workspace
  • Présentation des notebooks
  • Créer les composants d’Azure Databricks (cluster, job, pool)

 

EXTRACTION DES DONNÉES

  • Les différentes tables (schemas, databases, tables)
  • Les sources et les destinations
  • Naviguer sur les fichiers système
  • Le dossier Filestore
  • Importer les données depuis son ordinateur
  • Importer les données du web
  • Importer les données avec SQL et Python
  • Connecter ses données Excel, PowerBI et PyCharm

 

TRANSFORMATION DES DONNÉES

  • Trouver et modifier les valeurs null
  • Supprimer les données dupliquées
  • Supprimer les valeurs extrêmes
  • Mise en cache
  • Compression des données

 

CHARGEMENT DES DONNÉES

  • Méthodes de sauvegarde
  • Managed vs unmanaged tables
  • Gérer les partitions
  • Connexion avec Azure SQL, Oracle et MongoDB

 

DASHBOARD ET DÉPLOIEMENT DU PROCESSUS

  • Notebooks de tableaux de bord
  • Créer un travail planifié pour rafraîchir le dashboard
  • Présentation d’un pipeline Azure Databricks CI/CD
  • Développer et valider son code
  • Définir son pipeline de build
  • Définir son pipeline de mise en version

Pour aller plus loin

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

26 mars 2024

Les + : Très clairs et précis

Les – : ras

Je souhaite suivre : Probablement une partie sur Azure devops plus précisément.

En synthèse : très bien

Maxime R. de chez COLAS SA

Afficher tous les témoignages

26 mars 2024

Les + : Très clairs et précis

Les – : ras

Je souhaite suivre : Probablement une partie sur Azure devops plus précisément.

En synthèse : très bien

Maxime R. de chez COLAS SA
26 mars 2024

Les + : Très bonne présentation globale d’Azure Databricks. Le formateur s’adapte très facilement et à l’écoute des stagiaires. Il a su répondre aux demandes et a su proposer de nouveaux TP en fonction du rythme d’avancement. L’alternance théorie/pratique est bien dosée

Les – : peut être qu’un journée de plus aurait été nécessaire

Sébastien Q. de chez COLAS SA
26 mars 2024

Les + : Une formation adaptée au besoin

Les – : Les accès à la formation de Databricks doivent être apportés par les clients

Je souhaite suivre : Aucune

Lajoie B. de chez COLAS SA
26 mars 2024

Les + : Adaptabilité, didactique, professionnel

Terence B. de chez COLAS SA
26 mars 2024

Les + : L’adaptabilité des TP au niveau des participants

Je souhaite suivre : Découverte de l’outil Azure DevOps

Sébastien D. de chez COLAS SA
26 mars 2024

Les + : Alternance théorie et pratique

Les – : Un petit peu très guidée mais très bien pour l’initiation à Databricks

Maroua A. de chez COLAS SA

Noter la formation

Prix 1590€ HT / personne
Durée 2 jours (14 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp