Moteurs de recherche
Les moteurs sont des outils quantitatifs qui référencent des pages, alors que les annuaires références des sites. Ainsi, suite à une requête sur un moteur, vous accèdez directement à une page.
Un moteur de recherche se compose d'un robot (spider ou araignée) qui parcourt le web à l'affût de nouveaux sites, et d'un outil d'indexation. Lorsque vous tapez une requête, le moteur va d'abord rechercher dans son index le / les termes de la requête puis va rechercher dans les pages (plein texte) pour ensuite classer les résultats par ordre de pertinence.
Les moteurs de recherchent n'indexent pas toutes les pages d'un site. AltaVista par exemple n'indexe que 400 pages d'un site.
Certains moteurs utilisent les mêmes bases de données (l'une des plus utilisées est dmoz - http://dmoz.org, une base constituée bénévolement). La différence entre les moteurs réside dans leur algorithme de calcul de la pertinence des résultats.
Le calcul de la pertinence se faisait en comptabilisant le nombre d'occurrence d'un terme (ou d'une suite de terme) dans un texte et en prenant en compte leur proximité. Pour cela, non seulement le texte de la page était pris en compte mais aussi les meta balises (ou meta tag). Cependant, suite à des abus, mais aussi pour des raisons de performance, d'autres méthodes ont été élaborées, entre autre l'indice de popularité. Les moteurs utilisent différents algorithmes pour le calculer :
Le problème des moteurs de recherche est que les résultats ne sont pas classés par thèmes, ils apparaîssent par ordre de pertinence. Face à ce désordre, le moteur Nothernlight (http://www.northernlight.com) propose un type de classement par thème. Ainsi, une fois que vous avez posé votre requête, la page de résultats apparaît avec à gauche une liste de thèmes regroupant les différents résultats trouvés. En cliquant sur un thème, vous n'avez que les résultats propre à un domaine particulier. Un autre outil utilise ce principe : iLor (http://www.ilor.com). Cet outil ne fonctionne bien que sur le web américain.
Le problème des moteurs est le nombre de résultats qu'ils renvoient suite à une requête. Afin de réduire le nombre des résultats, il convient de connaître un minimum les opérateurs booléens, voire la recherche avancée qui permet de réduire la recherche à certains champs des pages indexées. Cependant, les opérateurs booléens varient dans leur forme d'un moteur à un autre.
Syntaxe de quelques moteurs de recherche ( source : abondance - http://www.abondance.com/outils/comparatif.html)
AltaVista | HotBot | Infoseek | Northern Light | Excite | Lycos | Web Crawler | All The Web | ||
OU | Par défaut | Choix any of the words | Par défaut | OR | Par défaut ou OR | Par défaut ou OR | Par défaut ou OR | Non utilisé | Choix any of the words |
ET | Signe + | Choix all the words ou signe + | Signe + | AND ou signe + | AND ou signe + | Signe + | AND ou signe + | Opérateur par défaut ou signe + | Choix all the words ou signe + |
SAUF | Signe - | Signe - | Signe - | NOT ou signe - | AND NOT ou signe - | Signe - | NOT ou signe - | Signe - | Signe - |
Expression | Guillemets | Guillemets | Guillemets | Guillemets | Guillemets | Guillemets | Guillemets | Guillemets | Guillemets |
Troncature | * | * | Non | * | Non | Non | Non | Non | Non |
Recherche linguistique (nombre de langues) | Oui (25) | Oui (7) | Non | Oui (5) ** | Non | Oui (15) ** | Non | Oui (11) | Oui (31)** |
Recherche sur le titre | title: | title: | title: | title: | Non | Choix "Title only" ** | Non | Non | Choix "in the title"** |
Recherche sur le domaine | domain: | domain: | site: | url: | Non | Non | Non | site: | Choix "in the url"** |
Recherche sur le nom du serveur | host: | domain: | site: | url: | Non | Choix Title dans la zone "Page field"** | Non | site: | Choix "in the url"** |
Recherche sur l'URL | url: | Non | url: | url: | Non | Choix URL dans la zone "Page field"** | Non | Non | Choix "in the url"** |
Recherche sur les adresses des liens | link: | linkdomain: | link: | Non | Non | Non | Non | link: | Choix "in the link to url"** |
L'utilisation d'un moteur de recherche se fait principalement dans 2 cas :
Remarque : il se peut que dans certains cas, l'un des résultat vous amène à une page d'erreur 404 (ou à un message tel que 'la page n'existe plus'). Google vous offre la possibilité d'avoir accès à une page qui n'est plus en ligne en cliquant sur Copie cachée. Google stocke les pages du web sur des disques durs.
Afficher rapidement les résultats
Les internautes demandent à ce que les résultats s'affichent le plus rapidement possible, or lorsque la page contient non seulement les résultats mais aussi des bannières de pub ou des informations connexes (météo, actualités, ...), le temps d'affichage est ralongé. Face au succès de Google dont l'interface est vraiment minimale, de plus en plus de moteurs offrent une interface simplifiée : Voilà, en cliquant sur Voilà pour les geeks - http://www.voila.fr/Geek (cela signifie idiot et c'est ainsi que s'appellent entre eux certains informaticiens); Altavista, en cliquant sur Recherche en mode texte - http://fr.altavista.com/searchtxt.
De nouvelles technologies de recherche voient le jour, par exemple, la technologie NG. A la suite d'une requête, le moteur de recherche suggère une liste de termes ayant un rapport avec les mots de la demande. L'utilisateur peut inclure ou non des éléments de cette liste aux termes de sa question. A une question portant sur "Poutine et Russie", des éléments tels que "Tchétchénie", "le FSB","les présidentielles en Russie" apparaîtont, en ajoutant certains de ces termes on affine sa requête. Le moteur Exalead (http://www.exalead.com) propose cette technologie.
Une autre technologie, toute droit issue de l'IA (Intelligence Artificielle) existe, mais les résultats ne semblent pas encore être là. Cete technologie se nomme DWIM (Do What I Mean). Elle consiste à éviter, lorsqu'il y a synonymie, d'accéder à des pages ne portant pas sur le bon sujet.
Au lieu d'interroger une base de données directement, certains moteurs vous propose de poser votre question à un documentaliste qui réalisera la recherche et vous communiquera, par courriel par exemple, les résultats qu'il a trouvés. Le procédé peut être plus interactif, au sens où vous dialoguerez avec ce documentaliste afin d'affiner votre requête et la prestation ne s'arrêtera que lorsque vous aurez trouvé les documents pertinents. Ce type de service ressemble plus il est vrai à un call center web.
Selon les moteurs, cette prestations est gratuite ou non.
Moteurs de recherche humains
|
||
webhelp (http://www.webhelp.fr)
|
Question (http://www.question.fr)
|
woonoz (http://www.woonoz.com)
|
Listes
de moteurs de recherche humains (http://www.netsurf.ch/askexperts.html)
|
Moteurs français
|
||
Altavista (http://www.altavista.fr) | Google (http://www.google.com) | Lycos (http://www.lycos.fr) |
Hotbot (http://www.hotbot.lycos.fr) | Wanadoo (http://www.wanadoo.fr) | |
Liste de moteurs de recherche francophones (http://www.enfin.com/linksengine.php?viewCat=3) | ||
Moteurs internationaux | ||
Altavista (http://www.altavista.com) | Google (http://www.google.com) | Nothernlight (http://www.northernlight.com) |
Webcrawler (http://www.webcrawler.com) |
Yakeo
(http://yakeo.ovh.org) : vous
choississez votre pays, vous tapez votre requête et vous choisissez
le moteur local que vous voulez utiliser. Très pratique.
|
|
Liste des outils de recherche mondiaux (http://www.ariane6.com/moteurs.htm) |
Remarque : Google vous permet d'intégrer sa Toolbar (http://toolbar.google.com/intl/fr) dans votre navigateur, ainsi, sans avoir à aller sur le site de Google, vous pouvez l'interroger. Pour cela, cliquez sur Installer la barre d'outils Google et suivez la procédure. Automatiquement, cette barre apparaîtra sous la barre de menu de votre navigateur. Cette barre de Google vous permet de poser une question, de mettre en surbrillance les termes de votre requête dans la page de résultats, ... .
Moteurs de recherche spécialisés | ||
Acronym Finder (http://www.mtnds.com/af) | Trouver des abrévations ou des acronymes | |
CitéFutée (http://www.citefutee.com) | Vous voulez savoir comment aller à un endroit en métro / RER | |
Dictionnaire universel francophone (http://www.francophonie.hachette-livre.fr) | Vous recherchez un terme ou sa définition. | |
@dresse
finder (http://www.iaf.net) People Search de Yahoo (http://people.yahoo.com) |
Permet de rechercher un courriel, à condition que la personne soit déclarée auprès d'un FAI. | |
Enginus (http://212.180.76.120/pages/default.asp) | Le moteur de recherche de l'industrie | |
GoGraph
(http://fr.gograph.com) Picsearch (http://www.picsearch.com) |
Moteur de recherche d'images | |
Download
(http://www.downloads.com) Megagiciels (http://www.megagiciel.com) Shareware (http://www.shareware.com) |
Recherche de logiciels freeware, shareware, en démo. | |
Maporama (http://www.maporama.com) | Trouver une adresse (rue, ville, ...) | |
Mirago (http://www.mirago.fr) | Ce moteur permet une recherche par région française. | |
Pages jaunes (http://www.pagesjaunes.fr) | Annuaire de france Telecom | |
RocketNews (http://www.rocketnews.com) | Moteur de recherche d'actualités en anglais | |
service-public.fr
(http://www.service-public.fr) |
Moteur de recherche des sites publics | |
Ticketnet.fr (http://www.ticketnet.fr/shop/fr/accueil.asp) | Vous recherchez un artiste ou un spectacle. | |
Trouvez (http://www.trouvez.com) | Pour les cyber-consommateurs | |
Moteurs de recherche pour les forums | ||
Liszt (http://www.liszt.com) | Tile (http://www.tile.net) |
Remarque : certains outils de recherche ont un opérateur particulier pour trouver un élément multimédia. Ainsi, pour trouver sur Voilà ou Hotbot une image, vous pouvez taper : +"père noël" +feature:image; pour trouver un son : +canard +feature:sound.