Formation Azure Databricks
1590€ HT / personne |
2 jours (14 heures) |
Présentation
Azure Databricks est la solution pour manipuler un nombre massif de clusters de base de données. Azure Databricks s’appuie sur la puissance du Cloud de Microsoft pour simplifier votre processus Big Data.
Azure Databricks est une version améliorée d’Apache Spark géré entièrement par Azure. Le système est alors facilement scalable et contrôlable afin de réduire vos coûts durant la phase de développement.
Le système dispose de différents connecteurs comme ADSL, Azure SQL DW ou encore PowerBI. C’est également un outil hautement sécurisé, intégrant le cadre de sécurité Azure Active Directory.
Notre formation Azure Databricks vous enseignera comment utiliser cet outil lors de votre processus ETL. Nous vous présenterons comment extraire, transformer et charger des donnés avec Azure Databricks, nous évoquerons aussi la création de dashboard et de pipelines.
Notre formation Azure Databricks présentera la dernière version de l’outil à savoir, Azure Databricks 8.
Objectifs
- Bien connaître les spécificités de Azure Databricks
- Extraire les données avec Azure Databricks
- Savoir comment transformer et charger ses données
- Utiliser les dashboards et déployer son processus
Public visé
- Développeurs
- Data Engineer
- Architectes
- Administrateurs système
- Data miners
- Data scientists
- Data analysts
- Business intelligence analysts
- Market inteligence analysts
Pré-requis
- Avoir idéalement suivi nos formations Spark ML ou Spark Tuning Avancé
- Connaissance en SQL et Python.
Programme de la formation Azure Databricks
INTRODUCTION
- Présentation de Databricks
- Les bénéfices de l’outil
- Databricks vs Apache Spark
- Présentation de l’interface
- Créer son workspace
- Présentation des notebooks
- Créer les composants d’Azure Databricks (cluster, job, pool)
EXTRACTION DES DONNÉES
- Les différentes tables (schemas, databases, tables)
- Les sources et les destinations
- Naviguer sur les fichiers système
- Le dossier Filestore
- Importer les données depuis son ordinateur
- Importer les données du web
- Importer les données avec SQL et Python
- Connecter ses données Excel, PowerBI et PyCharm
TRANSFORMATION DES DONNÉES
- Trouver et modifier les valeurs null
- Supprimer les données dupliquées
- Supprimer les valeurs extrêmes
- Mise en cache
- Compression des données
CHARGEMENT DES DONNÉES
- Méthodes de sauvegarde
- Managed vs unmanaged tables
- Gérer les partitions
- Connexion avec Azure SQL, Oracle et MongoDB
DASHBOARD ET DÉPLOIEMENT DU PROCESSUS
- Notebooks de tableaux de bord
- Créer un travail planifié pour rafraîchir le dashboard
- Présentation d’un pipeline Azure Databricks CI/CD
- Développer et valider son code
- Définir son pipeline de build
- Définir son pipeline de mise en version
Pour aller plus loin
Formation Azure Machine Learning
Formation Gouvernance avec Azure
Formation AZ-104
Formation Azure Data Factory
Formation Serverless
Formation Terraform
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
1590€ HT / personne |
2 jours (14 heures) |