Formation Vertica Analytics Platform
€ HT / personne |
2 jours (14 heures) |
Présentation
Maîtrisez Vertica Analytics Platform dans sa dimension experte grâce à cette formation complète, pensée pour les ingénieurs data, architectes et analystes souhaitant exploiter tout le potentiel de cet entrepôt de données haute performance.
La formation débute par une plongée dans l’architecture MPP de Vertica, son stockage en colonnes, ses projections, et les mécanismes de segmentation, de réplication et de haute disponibilité. Vous saurez dimensionner et configurer vos clusters pour garantir performance et résilience.
Vous apprendrez à ingérer efficacement des volumes massifs de données, en temps réel ou par batch, via COPY, Kafka, Spark, ou des ETL comme Talend. La modélisation optimisée (partitionnement, projections) devient un levier essentiel de performance.
Vous maîtriserez le requêtage SQL avancé, les fonctions analytiques, le profiling des requêtes, ainsi que la compression et le tuning avec Database Designer. L’intégration BI, les API, Python et le machine learning natif vous permettront de valoriser vos données à grande échelle.
Comme pour toutes nos formations, celle-ci vous sera présentée avec les toutes dernières actualisations de Vertica Analytics Platform
Objectifs
- Comprendre l’architecture avancée de Vertica, son fonctionnement en MPP
- Savoir concevoir, modéliser, segmenter et optimiser des schémas de données performants dans Vertica
- Maîtriser les stratégies d’ingestion de données massives via COPY, Kafka, Spark ou ETL
- Être capable de sécuriser, gouverner et tracer les accès, traitements et audits dans des environnements critiques
- Savoir industrialiser les traitements et déploiements Vertica avec scripts, automatisations CI/CD
- Exploiter le moteur analytique et machine learning natif de Vertica pour réaliser des analyses prédictives
Public visé
- Data Engineers
- Architectes data
Pré-requis
- Maîtrise des bases du langage SQL
Programme de la formation Vertica Analytics Platform
Introduction à Vertica
- Architecture de Vertica
- Cas d’usage
- Comparaison avec d’autres entrepôts de données
- Composants clés de la plateforme Vertica
Architecture et Concepts de Base
- Architecture distribuée en colonnes
- Stockage en colonnes vs en lignes
- Modèle MPP
- Concepts fondamentaux
- Projections
- ROS/WOS
- Segmentation et partitionnement
- Sharding et réplication des données
- Architecture de haute disponibilité
Installation et Configuration
- Prérequis système et réseau
- Installation en cluster
- Mononœud vs multinœud
- Configuration initiale
- Paramétrage du cluster
- Sécurité et pare-feu
- Interface de management
Ingestion de données
- Méthodes d’ingestion
- COPY, INSERT, EXPORT
- COPY LOCAL vs COPY DIRECT
- Chargement en masse
- Gestion des erreurs
- Optimisation de l’ingestion
- Intégration avec d’autres outils
- Kafka, Spark, Hadoop
- Connecteurs ETL
- Ingestion continue et en temps réel
Modélisation des données
- Schémas et bases de données
- Création de tables
- Types de données supportés
- Contraintes et index
- Projections
- Création manuelle vs automatique
- Optimisation des projections pour les requêtes
- Partitionnement et segmentation
Requêtage SQL dans Vertica
- Compatibilité SQL
- Fonctions standards et spécifiques
- Fonctions analytiques avancées
- Fenêtres, agrégations, regroupements
- Requêtes temporelles
- Requêtes avec joins et subqueries
- Requêtes distribuées sur plusieurs nœuds
Optimisation des performances
- Analyse du plan d’exécution
- EXPLAIN et PROFILE
- Projection tuning
- Utilisation de Database Designer
- Compression des données
- Gestion des ressources
- Workload Management
- Monitoring des performances
- Vertica Management Console
- Tables de logs et vues système
Sécurité et gestion des accès
- Authentification et autorisation
- Rôles, utilisateurs, groupes
- Sécurité des données
- Chiffrement au repos et en transit
- Audits et surveillance
- Journaux d’accès
- Sécurisation des requêtes sensibles
Maintenance et administration
- Rebalancing et projections non utilisées
- Optimisation des projections et des segments
- Sauvegarde et restauration
- Backup incrémental
- VBR
- Upgrade de version et maintenance planifiée
Visualisation et BI
- Connexion avec des outils BI
- Tableau, Power BI, Looker, Qlik
- Intégration via ODBC/JDBC
- Création de dashboards et requêtes analytiques
- Cas pratiques de visualisation avec Vertica
Intégrations avancées
- Intégration avec Hadoop / Hive
- Intégration avec Spark
- Intégration avec Python / R (Machine Learning)
- API REST et SDK Vertica
Machine Learning avec Vertica
- Introduction à Vertica ML
- Modèles disponibles en natif
- Création de jeux d’entraînement
- Entraînement de modèles
- Évaluation et prédiction
- Intégration avec notebooks Jupyter
Déploiement et DevOps
- CI/CD avec Vertica SQL scripts
- Versioning des schémas
- Automatisation avec scripts Bash / Python
- Utilisation de conteneurs et déploiement Kubernetes
Pour aller plus loin
Formation Mage
Formation Oracle 23
Formation SQL
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS