Formation RapidMiner Mining Core
€ HT / personne |
3 jours (21 heures) |
Présentation
Maîtrisez la fouille de données visuelle avec RapidMiner grâce à cette formation complète et opérationnelle. Conçue pour les professionnels de la data, elle vous permettra de prendre en main l’ensemble des fonctionnalités de RapidMiner Mining Core.
Vous commencerez par explorer l’interface de RapidMiner Studio et les étapes clés du cycle CRISP-DM. L’accent est mis sur l’importation, le nettoyage et la transformation des données pour construire des jeux de données fiables et exploitables.
Vous apprendrez ensuite à développer des modèles de classification, de régression ou de clustering, à les évaluer finement, et à automatiser vos flux avec Auto Model et l’optimisation des paramètres. Des cas concrets renforcent chaque compétence.
Enfin, la formation couvre l’export des résultats, l’intégration dans un environnement métier et les bonnes pratiques d’analyse visuelle, pour vous permettre de déployer des projets data performants, durables et réplicables.
Comme pour toutes nos formations, celle-ci vous sera présentée avec les toutes dernières actualisations de RapidMiner.
Objectifs
- Comprendre l’écosystème RapidMiner et le cycle de vie CRISP-DM
- Configurer l’environnement RapidMiner Studio et importer des données multi-sources
- Préparer, transformer et enrichir les jeux de données pour l’analyse
- Concevoir, entraîner et évaluer des modèles prédictifs et non supervisés
- Automatiser les workflows analytiques avec Auto Model et l’optimisation des paramètres
- Intégrer RapidMiner dans un processus de production analytique fiable et industrialisé
Public visé
- Data Analyst
- Data scientists
Pré-requis
- Maitrise de SQL
Programme de la formation RapidMiner Mining Core
Introduction à RapidMiner et au Data Mining
- Positionnement dans l’écosystème de la data science
- Définition de la fouille de données
- Cycle de vie d’un projet de data mining
- Présentation des panels : repository, design, parameters
- Démarrage d’un nouveau processus
- Comprendre l’organisation d’un workflow
Importation et préparation des données
- Chargement de fichiers
- Connexions aux bases de données et Web Services
- Repository RapidMiner : gestion des datasets
- Nettoyage et transformation des données
- Remplissage ou suppression des valeurs manquantes
- Normalisation, discrétisation, encodage
- Filtrage, échantillonnage, tri, fusion et jointure de tables
- Replace Missing Values, Normalize, Filter Examples
- Generate Attributes pour créer des variables dérivées
Analyse exploratoire et visualisation
- Moyenne, médiane, écart-type, distribution
- Visualisation des outliers
- Histogrammes, boxplots, scatter plots
- Heatmaps et matrices de corrélation
- Graphiques interactifs dans RapidMiner
Sélection et réduction de variables
- Méthodes intégrées : Weight by Information Gain, Weight by Gini Index
- Élimination des variables redondantes ou inutiles
- PCA (Analyse en Composantes Principales)
- t-SNE pour visualisation de hautes dimensions
Modélisation prédictive supervisée
- Algorithmes : Decision Tree, Naive Bayes, SVM, k-NN, Random Forest
- Utilisation des opérateurs Train, Apply Model, Cross Validation
- Analyse des performances : accuracy, recall, precision, F1-score
- Régression linéaire, régression Ridge/Lasso
- Modèles de régression dans RapidMiner
Clustering et modélisation non supervisée
- k-Means, k-Medoids, DBSCAN
- Analyse des distances et des similarités
- Indice de Silhouette, Davies-Bouldin Index
- Visualisation des clusters
Évaluation des modèles
- Cross-validation, split training/test
- Matrice de confusion
- ROC, AUC, courbes Lift et Gains
- Analyse du sur-apprentissage
Automatisation et optimisation
- Auto Model dans RapidMiner
- Utiliser Auto Model pour des cas rapides
- Personnalisation du choix d’algorithme et d’évaluation
- Optimisation d’hyperparamètres
- Grid Search, Evolutionary Parameter Optimization
- Mesure d’impact des paramètres
Intégration et exportation
- Export CSV, Excel, base de données
- Génération de rapports et dashboards
- Intégration avec d’autres systèmes
- RapidMiner Server
- Appels via API ou Web Services
Pour aller plus loin
Formation Mage
Formation Oracle 23
Formation SQL
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
€ HT / personne |
3 jours (21 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS