Moteurs de recherche

introduction

Search Engine fait référence à une énorme base de données de ressources Internet telles que des pages Web, des groupes de discussion, des programmes, des images, etc. Il permet de localiser des informations sur le World Wide Web.

L'utilisateur peut rechercher n'importe quelle information en passant une requête sous forme de mots-clés ou d'expressions. Il recherche ensuite les informations pertinentes dans sa base de données et retourne à l'utilisateur.

Composants du moteur de recherche

Généralement, il existe trois composants de base d'un moteur de recherche, comme indiqué ci-dessous:

  1. Crawler Web

  2. Database

  3. Interfaces de recherche

Crawler Web

Il est également connu sous le nom de spider ou bots. C'est un composant logiciel qui parcourt le Web pour recueillir des informations.

Base de données

Toutes les informations sur le Web sont stockées dans la base de données. Il se compose d'énormes ressources Web.

Interfaces de recherche

Ce composant est une interface entre l'utilisateur et la base de données. Il aide l'utilisateur à rechercher dans la base de données.

Moteur de recherche fonctionnant

Le robot d'exploration Web, la base de données et l'interface de recherche sont le composant principal d'un moteur de recherche qui fait fonctionner le moteur de recherche. Les moteurs de recherche utilisent l'expression booléenne AND, OR, NOT pour restreindre et élargir les résultats d'une recherche. Voici les étapes qui sont effectuées par le moteur de recherche:

  • Le moteur de recherche recherche le mot-clé dans l'index de la base de données prédéfinie au lieu d'aller directement sur le Web pour rechercher le mot-clé.

  • Il utilise ensuite un logiciel pour rechercher les informations dans la base de données. Ce composant logiciel est appelé robot d'exploration Web.

  • Une fois que le robot d'exploration a trouvé les pages, le moteur de recherche affiche ensuite les pages Web pertinentes. Ces pages Web récupérées incluent généralement le titre de la page, la taille de la partie du texte, les premières phrases, etc.

Ces critères de recherche peuvent varier d'un moteur de recherche à l'autre. Les informations récupérées sont classées en fonction de divers facteurs tels que la fréquence des mots-clés, la pertinence des informations, les liens, etc.

  • L'utilisateur peut cliquer sur l'un des résultats de la recherche pour l'ouvrir.

Architecture

L'architecture du moteur de recherche comprend les trois couches de base énumérées ci-dessous:

  • Collecte et raffinement de contenu.

  • Rechercher le noyau

  • Interfaces utilisateur et application

Traitement des moteurs de recherche

Processus d'indexation

Le processus d'indexation comprend les trois tâches suivantes:

  • Acquisition de texte

  • Transformation de texte

  • Création d'index

Acquisition de texte

Il identifie et stocke les documents à indexer.

Transformation de texte

Il transforme le document en termes d'index ou en fonctionnalités.

Création d'index

Il prend des termes d'index créés par des transformations de texte et crée des structures de données pour soutenir une recherche rapide.

Processus de requête

Le processus de requête comprend les trois tâches suivantes:

  • Interaction de l'utilisateur

  • Ranking

  • Evaluation

Interaction de l'utilisateur

Il prend en charge la création et le raffinement de la requête utilisateur et affiche les résultats.

Classement

Il utilise des requêtes et des index pour créer une liste classée de documents.

Évaluation

Il surveille et mesure l'efficacité et l'efficience. Cela se fait hors ligne.

Exemples

Voici les différents moteurs de recherche disponibles aujourd'hui:

Moteur de recherche La description
Google Il s'appelait à l'origine BackRub. C'est le moteur de recherche le plus populaire au monde.
Bing Il a été lancé en 2009 par Microsoft. Il s'agit du dernier moteur de recherche Web qui fournit également les résultats de Yahoo.
Demander Il a été lancé en 1996 et était à l'origine connu sous le nom de Ask Jeeves. Il inclut la prise en charge de la correspondance, du dictionnaire et des questions de conversation.
AltaVista Il a été lancé par Digital Equipment Corporation en 1995. Depuis 2003, il est alimenté par la technologie Yahoo.
Recherche AOL Il est alimenté par Google.
LYCOS Il s'agit du top 5 des sites Internet et de la 13e plus grande propriété en ligne selon Media Matrix.
Alexa Il est une filiale d'Amazon et est utilisé pour fournir des informations sur le trafic du site Web.