Description

Durée : 28 heures
Modalités techniques d’évaluation : Évaluation des connaissances par QCM, évaluation des compétences au travers de travaux pratiques et de cas d’études. Contrôle de l’acquisition des connaissances et des compétences pendant la formation par le formateur.
Moyens pédagogiques : Apports théoriques réalisés en classe et complétés par de nombreux travaux pratiques permettent aux participants de disposer d’une expérience concrète. A l’issue des sessions magistrales, réalisation de cas d’études tutorés.

Objectifs

  •  Mettre en place une indexation avec Solr 
  • Modéliser les unités d’indexation d’un site web 
  • Développer les services de recherche 
  • Analyser les performances de votre moteur de recherche avec SolrMeter  $
  • Déployer le moteur de recherche suivant différentes topologies. 

Programme détaillé

Fondamentaux de la Recherche d’Information (RI)

  • Définitions
  • RI Web & RI Entreprise
  • Bases
  • Construction de l’index Solr
  • Modèle booléenne et vectoriel de recherche d’information

Indexation du Web

  • Historique de l’innovation des principaux moteurs de recherche
  • Organisation des documents du Web
  • Construction du dictionnaire des termes
  • Stockage de l’index
  • Répondre à une requête de l’utilisateur
  • Mise à l’échelle du moteur de recherche
  • Le cas Google Search Engine

Solutions Open Source LUCENE / Solr

  • Présentation de la librairie Apache LUCENE
  • Présentation du serveur Apache Solr

Indexation avec Solr

  • Structure du répertoire d’installation de Solr
  • Comprendre le concept Solr Core
  • Les fichiers de configuration
  • Schéma des documents et analyse des textes
  • Les modes de communication avec Solr
  • Le framework Data Import Handler (DIH) de Solr
  • Indexer les fichiers avec Solr Cell

Recherche avec Solr

  • Les paramètres de recherche
  • La syntaxe des requêtes
  • Parseur de requête Lucene vs parseur de requête Dismax
  • Recherche géospatiale
  • Influencer la pertinence des résultats
  • Recherche par facettes pour une meilleure expérience de l’utilisateur
  • Les composants Highlight et MoreLikeThis
  • Aller au-delà de la recherche par mots-clés

Mise à l’échelle de Solr

  • Evaluer les performances de Solr avec SolrMeter
  • Optimiser une instance unique de Solr
  • Passer à plusieurs serveurs avec Solr Replication et/ou Solr Cloud