Formations BigData & NoSql Formation Data Lake : Créer son Architecture de données

Formation Datalake

Rated 0 out of 5
logo formation datalake
Prix 1600€ HT / personne
Durée 2 jours ( 14 heures )
Paris | à distance | FNE
Il ne reste que quelques places
Option OFFERTE de classe virtuelle (40€/j en supplément)
Disponible en intra-entreprise pour former votre équipe

Présentation

L’augmentation phénoménale des données non structurées nous pousse à maîtriser l’analyse et le traitement des datalakes, aussi appelés « lac de données ».

Le data lake est un ensemble regroupant une grande quantité de données hétérogènes. Ces données peuvent désormais être traitées de manière opérationnelle en temps réel.

La maîtrise d’une approche data lake vous permettra de découvrir des données rares et diverses pouvant avoir un fort impact sur les performances de votre organisation.

Cette formation datalake de 2 jours vous enseignera comment ingérer, modifier et stocker vos données. Vous apprendrez également comment implémenter une architecture lambda.

 

Objectifs

  • Comprendre le métier de Data Engineer
  • Monter un Datalake
  • Mettre à disposition rapidement un important volume de données prêtes à l’emploi

 

Public visé

  • Data Scientists
  • Devops
  • Développeurs
  • Vous travaillez avec data engineers
 

Pré-requis

Base en programmation

Programme de notre formation Datalake

 

QU’EST-CE QUE LE BIG DATA ?

• Définition du Big Data
• Définition du Data Engineering
• Cartographie des compétences
• Principaux use cases de Data Engineering
Atelier pratique : mise en place de l’environnement

 

UTILITÉ D’UN DATALAKE

• Théorème de CAP
• Qu’est-ce qu’un ETL et un ELT ?
• Définition d’un datalake
• Système de fichiers distribués
Atelier pratique : manipulation de noeuds HDFS

 

INGESTION DES DONNÉES

• Manipulation de données en temps réel avec Kafka
• Gestion des flux de données avec Nifi
Atelier pratique : ingestion de données en temps réel dans un datalake avec Nifi et Kafka

 

TRANSFORMATION DES DONNÉES

• Différence entre données structurées et non structurées
• Le paradigme MapReduce
• L’écosystème Hadoop
• Transformation de données avec Spark
Atelier pratique : uniformisation du format et enrichissement des données sur un data lake

 

MISE À DISPOSITION DE LA DONNÉE

• Définition d’un Datawarehouse
• Valeur ajoutée de Hyve pour l’exposition des données
• Atelier pratique : mise à disposition des données structurées avec Hyve
• Visualisation de données structurées

 

ARCHITECTURE LAMBDA

• Qu’est-ce qu’une architecture Lambda
• Implémentation d’une architecture Lambda dans un Datalake
Atelier pratique : implémentation d’une Architecture Lambda

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

Afficher tous les témoignages

Noter la formation
Prix 1600€ HT / personne
Durée 2 jours ( 14 heures )

Paris | à distance | FNE
Il ne reste que quelques places
Option OFFERTE de classe virtuelle (40€/j en supplément)
Disponible en intra-entreprise pour former votre équipe

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.