| |
-
Les
recherches par index : Les engins de recherche par Index
utilisent un "web crawler" (que j'appellerai robot pour fins de
compréhension) qui parcourent des millions de pages Web et de
forums dans le but d'indexer leur contenu dans des bases de
données.
Le robot indexe le contenu d'une page et continu ensuite sur les
hyperliens de cette page pour trouver une autre page et ainsi
continuer à créer des index. Ces robots sont en fait des modules de
programmation qui utilisent différentes approches. Certains donnent
plus d'importance aux mots-clés placés dans le titre de la page,
d'autres sur la fréquence d'apparition des mots dans le texte de la
page, d'autres encore sur les mots placés dans les entêtes de
premier niveau. Certains robots vont indexer tout le contenu de la
page alors que d'autres vont indexer certains termes
significatifs.
Quelques exemples d'engins de recherche par Index:
-
ALTAVISTA: (versions
anglaise,
française et
arabe) Probablement le
plus connu. Conçu par Digital Equipment Corp (DEC) en 1995,
racheté par Compaq en 1998, est l'un des moteurs les plus grands
du Net en terme de pages indexées. Sa capacité à répertorier le
net et des commandes de recherches très poussées et avec des
possibilités de personnalisations le met en tête de listes de nos
moteurs. On peut aussi rechercher uniquement des textes, des
images, des vidéos ou des fichiers son.
-
LOKACE : (
http://www.lokace.com/ ). Le
plus élaboré engin de recherche par index en français. Les robots
ne recherchent que des contenus en français.
-
HOTBOT : (
http://www.hotbot.com/ )
Simple d'emploi, ce moteur de recherche offre de nombreux
réglages. Il affiche les réponses par titre, avec ou sans résumé,
donne les résultats des dix sites les plus consulté sur un sujet
donné et permet de rechercher uniquement des textes, des images,
des séquences vidéo ou des fichiers musicaux MP3.
-
Francité (
http://www.francite.fr/ )
Un autre engin de recherche par index québécois.
-
Google : (
http://www.google.com ) C'est
le meilleur engin de recherche du moment créé en décembre 1998 à
Menlo Park en Californie, qui tient compte de la popularité des
liens pour le classement des sites: Ceci est très important pour
trouver des sites intéressants sur des recherches larges telles
que "voitures" ou "agence". Google avec sa touche "I'm lucky"
vous envoie vers le site de votre choix et le plus populaire. A
reçu de nombreuses distinctions depuis début 1999.
-
Web Crawler : (
http://www.webcrawler.com
) . C'est le plus petit des moteurs de recherche. Ce n'est pas
l'endroit à aller pour chercher des renseignements spécifiques.
Avec moins de résultats, certaines personnes le trouveront plus
claires. Webcrawler a été crée en avril 1994 et était un projet
de l'université de Washington. AOL l'a acheté en 1995 jusqu'en
novembre 1996, Excite l'a racheté en novembre 1996. Excite
continue l'activité de WebCrawler comme moteur indépendant.
-
EXCITE: (versions
anglaise et
française) C'est l'un des
moteurs les plus populaires avec des versions personnalisés pour
la France, Italie.… . Excite fut lancé en 1995. Excite racheté
par @home en janvier 1999, avait avalé en 1996 Magellan et
WebCrawler. Ces deux services sont maintenus séparément. Excite
offre sa technologie à Netscape et AOL, c'est donc l'un des
acteurs majeurs des moteurs de recherches.
-
LYCOS : (versions
anglaise et
française) Lycos est un moteur
bien rodé et traduit en français. Un moteur qui accepte les
questions en langage naturel, mais qui semble pourtant plus à
l'aise avec les mots anglais qu'avec les mots français. Il offre,
également, la possibilité de ne rechercher que des textes, des
images, des vidéos ou des fichiers musicaux MP3.

|
|