Informatique
Elasticsearch
Pré-requis : Connaissances en administration système, préférablement Java
- Apprendre à utiliser Elasticsearch, de l’installation à son intégration en passant par sa configuration
- Utiliser le client et l’API Java d’Elasticsearch pour indexer et rechercher des documents
- Monitorer elasticsearch et comprendre les statistiques d’utilisation
Introduction aux moteurs de recherche
- Généralités
- Panorama des solutions de recherche open source
- Intégrer un moteur de recherche dans une application
- Les différentes versions d’Elasticsearch
Introduction à Elasticsearch
- Historique du projet
- Apache lucene
- Ce qu’apporte Elastisearch par rapport à lucene
Les bases d’Elasticsearch
- Principes de fonctionnement en cluster
- Installation
- Configuration
- Notion de node, d’index et de type
- Partitionnement de données
- Vue générale de l’api rest
Indexation de documents
- Conception de l’index et de ses documents
- Indexer ou supprimer des documents avec l’api rest
- Indexation en masse
- Version
- Pondération
- Autres fonctionnalités (routing, consistency, document enfant, …)
Mapping
- Définition et rôle du mapping
- Type de champs
- Les champs prédéfinis
- Méta données d’un index
Analyse et extraction de texte
- Base de l’extraction et analyse de texte
- Analysers
- Char filters
- Tokenizers
- Token filters
- Cas d’utilisation
- Configuration et utilisation des analyzers prédéfinis ou customisés
- Analyse de texte en plusieurs langues
- Suppresion de mots
- Extraction d’adresses email et d’urls
- Suppression de balises html dans du texte
- Mise en place de la correction orthographique
- Indexation de fichiers binaires (utilisation d’apache tika)
Recherche de documents
- Rechercher des documents avec l’api rest
- Gestion des résultats
- Les différents types de requêtes
- Différencier requêtes et filtres
- Types de filtres
- Combiner efficacement les filtres
- Pertinence
Fonctionnalités avancées de recherche
- Gestion de la pertinence et du score
- Suggestions
- Autocomplétion
- Highlighting
- Recherche objets / nested / parent-enfant
- More like this
- Recherche géospatiale
Fonctionnalités avancées
- Autres types de plugins Elasticsearch
- River: définition
- Scripting
- Pré-chauffer son cluster
- La percolation
- Maintenance des nodes
- Répartition des indexs sur différents nodes
- Requêtes et statistiques
- Architecte
- Développeur
- Chef de projet
- Big Data
- QCM final
- Projets en continu
- Durée: 2 jours
- Tarif: 1500 € HT
Dates des prochaines sessions :