Formation ElasticSearch

Logo Formation Elastic Search

1800€

1620€HT/ personne

3 jours (21 heures)

Interentreprises

­Paris

Disponible en intraentreprise pour former votre équipe.

Présentation

Elasticsearch est un moteur de recherche et d’indexation Open Source nouvelle génération. Sa nature distribuée et sa capacité à être résilient et hautement disponible ont déjà séduit des acteurs majeurs tels que Wikipedia, LinkedIn, Netflix, Ebay, ou WordPress. ElasticSearch a été spécialement conçu pour indexer de très gros volumes de données tout en assurant une montée en charge performante et une forte tolérance aux pannes.

Cette formation aborde les concepts des moteurs de recherche avant de détailler les fonctionnalités de base d’Elasticsearch. La formation apporte toutes les connaissances nécessaires pour utiliser et exploiter Elastic Search de façon efficace et résoudre les problématiques les plus souvent rencontrées.

La formation utilisera la dernière version stable en date du projet (Elasticsearch 6.4.2 à ce jour).

 

Objectifs

  • Apprendre à utiliser Elasticsearch, de l’installation à son intégration en passant par sa configuration
  • Utiliser le client et l’API Java d’Elasticsearch pour indexer et rechercher des documents
  • Monitorer elasticsearch et comprendre les statistiques d’utilisation

 

Public visé

Architecte, Développeur, Chef de projet, Big Data

 

Pré-requis

Connaissances en Java & Linux

 

Pour aller plus loin

Afin de compléter cette formation nous vous proposons une formation sur l’administration et exploitation d’Elasticsearch

Programme de la formation ElasticSearch

 

Introduction aux moteurs de recherche

  • Généralités
  • Panorama des solutions de recherche Open Source
  • Intégrer un moteur de recherche dans une application
  • Enjeux et clés de succès

 

Introduction à Elasticsearch

  • Historique du projet
  • Apache Lucene
  • Ce qu’apporte Elastisearch par rapport à Lucene

 

Les bases d’Elasticsearch

  • Principes de fonctionnement en cluster
  • Installation
  • Configuration
  • Notion de Node, d’Index et de Type
  • Partitionnement de données
  • Vue générale de l’API Rest

 

Indexaction de documents

  • Conception de l’index et de ses documents
  • Indexer ou supprimer des documents avec l’API Rest
  • Indexation en masse
  • Version
  • Pondération
  • Autres fonctionnalités (routing, consistency, document enfant, …)

 

Mapping

  • Définition et rôle du mapping
  • Type de champs
  • Les champs prédéfinis
  • Méta données d’un Index

 

Analyse et extraction de texte

  • Base de l’extraction et analyse de texte
    • Analysers
    • Char filters
    • Tokenizers
    • Token Filters
  • Cas d’utilisation
  • Configuration et utilisation des Analyzers prédéfinis ou customisés
  • Analyse de texte en plusieurs langues
  • Suppresion de mots
  • Extraction d’adresses email et d’urls
  • Suppression de balises HTML dans du texte
  • Mise en place de la correction orthographique
  • Indexation de fichiers binaires (utilisation d’Apache Tika)

 

Recherche de documents

  • Rechercher des documents avec l’API Rest
  • Gestion des résultats
  • Types de requêtes
    • Requête de type match_all
    • Requête de type query_string/simple_query_string
    • Requête de type match (et dérivées)
    • Requête de type term et terms
    • Requête de type wildcard
    • Requête de type range
    • Requête de type fuzzy
    • Requête de type bool
    • Requête de type exist/missing
    • Requête de type and, or et not
    • Requête de type _type et _id
  • Différentier requêtes et filtres
  • Types de filtres
  • Combiner efficacement les filtres
  • Pertinence

 

Fonctionnalités avancées de recherche

  • Gestion de la pertinence et du score
  • Suggestions
  • Autocomplétion
  • Highlighting
  • Recherche Objets / Nested / Parent-Enfant
  • More Like This
  • Recherche géospatiale

 

Elasticsearch et API Java

  • Types de clients disponibles
  • Intégrer elasticsearch dans une application Java
    • Embarqué
    • Noeud client
    • Transport client
  • Utilisation de l’API Java
  • Indexer et rechercher des documents
  • Gérer les index
  • Gérer les mappings

 

Cloud et Clusterisation

  • Principe de fonctionnement d’un cluster elasticsearch
  • Prévenir les split brains
  • Configurer un cluster elasticsearch
  • Scalabilité et volumétrie de données
  • Sauvegarder et restaurer un cluster elasticsearch
  • Supervision d’un cluster elasticsearch :
    • l’API health
    • l’API state
    • l’API stats
    • l’API pending_task
    • l’API _nodes alias node info
    • l’API hot_threads
    • l’API _cat
    • Plugins de supervision
    • Logs

 

Fonctionnalités avancées

  • Autres types de plugins elasticsearch
  • River: définition
  • Scripting
  • Pré-chauffer son cluster
  • La percolation
  • Maintenance des nodes
  • Répartition des indexes sur différents nodes
  • Requêtes et statistiques

 

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Le(s) Formateur(s)

Jean-Baptiste

Jean-Baptiste

Avec plus de 15 ans d’expérience dans l’IT, dont plusieurs années passées au sein de la Société Générale, Jean-Baptiste se fera un plaisir de vous partager ses bonnes pratiques en tant qu’Architecte et Expert BPM des technologies Java / C#.

Témoignages

Donnez votre avis ?

Afficher tous les témoignages

Donnez votre avis ?

Noter la formation

1800€

1620€HT/ personne

3 jours (21 heures)

Interentreprises

­Paris

Disponible en intraentreprise pour former votre équipe.

Une question ? Un projet ?

Pour des informations complémentaires, n’hésitez pas à nous contacter.