ELAS – Le moteur de recherche et d’analyse distribué Elasticsearch

Référence : ELAS
Durée : 3 jours (21 heures)
Dernière mise à jour : juin 2024

Présentation

Construit sur la base du moteur d’indexation et de recherche Lucene, Elasticsearch a su tirer le maximum de cette librairie open source en y ajoutant des facilités d’interrogation et des fonctions de distribution en cluster autorisant une excellente montée en charge.
Aujourd’hui grâce à sa grande tolérance aux pannes, sa capacité à traiter de gros volumes de données et ses fonctionnalités d’analyse, Elasticsearch est devenu un moteur de recherche très populaire et cela bien au-delà du cercle des développeurs Java, premiers utilisateurs de Lucene.

Cette formation s’adresse à tous ceux désireux d’exploiter ce système de gestion de données. Les API, les stratégies d’indexation et de requêtage seront passées en revue. Par ailleurs, nous ne ferons pas l’impasse sur les principes architecturaux tant ils sont au cœur de la valeur ajoutée d’Elasticsearch. Un TP fil rouge réaliste accompagnera les stagiaires tout au long de leur apprentissage pour ainsi illustrer les cas d’utilisation où le moteur de recherche prend tout son sens.

Programme

Découverte
  • Une surcouche de Lucene
  • Les apports à la librairie historique
  • Une API CRUD simplifiée
  • Vous avez dit NoSQL ?
Architecture logiciel
  • Les nœuds, les indexes et les shards
  • Clusterisé par nature
  • Shard primaire et répliqué
  • Installation et paramétrage
Au cœur de l’API
  • API REST HTTP
  • De nombreux SDK (Java, Python…)
  • Exemples CRUD
  • Illustration avec Curl
  • Intégration dans une application existante
Modélisation des données
  • Les enjeux du mapping
  • Les types de données
  • Analysé ou pas ?
  • Choix de l’analyseur
  • Définir son propre analyseur
Focus sur la recherche
  • Recherche simple et composée
  • Filtres et requêtes
  • Tri et pagination des résultats
  • L’agrégation
  • Recherche géospatiale
  • La Percolation (Percolate Query)
Gestion du scoring
  • La fréquence des termes
  • Fréquence des termes dans l’index
  • Le nombre de documents
  • Le facteur taille du champ
  • Les boost
Visualisation des données avec Kibana
  • Kibana : sidebar, searchbar, toolbar, timefilter
  • Index pattern ou Data View
  • Les Search (ou vues) avec Discover
  • Les Vizualisation (ou métriques et graphiques) avec Vizualize Library
  • Gestion des objets : import, export, partage…
Administration et outillage
  • Traitements pipeline
  • Supervision du cluster
  • Sauvegarde et restauration
  • Optimisation des performances
  • La sécurité
  • Collecter les données avec Logstash

En présentiel

Nous dispensons nos formations en présentiel dans nos locaux de Toulouse ou dans vos locaux dans toute l’Europe.

En distanciel

Nous dispensons également nos formations à distance, sous forme de classe virtuelle en visio conférence, avec l’outil de votre choix (Google Meet, Teams, Zoom…).

Pour toute demande contactez-nous !

Méthode pédagogique

65% de travaux pratiques

Modalités d’évaluation

Travaux pratiques et QCM

Audience

Architectes et chefs de projets techniques, développeurs

Versions des technologies

Elasticsearch 8.x

Pré-requis

Quelques notions NoSQL, REST

Tarif

Nous consulter

    Votre nom (obligatoire)

    Votre email (obligatoire)

    Votre société (obligatoire)

    Votre demande

    captcha

    Témoignages clients

    Mélissa LAJUBERTIE – SOPRA STERIA

    « Formation très complète et bien structurée avec TP pour mettre en pratique la théorie. Formateur au top! »