>

Encyclopédia Britannica

 taille : 65 000 sites

 éditeurs : 25

 catégories :

Il ne síagit pas de rechercher de líinformation dans la célèbre encyclopédie mais dans un annuaire de plus de 65 000 sites. Les sites retenus sont classés en 14 catégories principales par une équipe de 25 experts. Il s'agit avant tout de signaler le meilleur. Environ 15% des sites sont recommandés (*), moins de 1% sont jugés exceptionnels (**) et environ 40 sont désignés les meilleurs du web (***).

 Recherche

On peut interroger un index des descriptions de ces sites. Un formulaire Recherche Avancée permet de limiter sa recherche soit par thèmes, soit par la note attribuée aux sites par Britannica.

On peut aussi élargir la recherche à AltaVista.

 Résultats

Líaffichage est limité au titre (lien vers le site) et à deux lignes de texte.
Chaque site reçoit une évaluation : Noteworthy | * Recommended | ** Exceptional | *** Best of the Web


Galaxy

 taille : sites

 éditeurs :

 catégories :

Galaxy est un annuaire produit par America's Health Network (AHN Partners). Galaxy est organisé en 11 grandes catégories, elles mêmes découpées en un nombre variable de sous-catégories.

 Recherche

En cliquant sur une catégorie ou une sous-catégorie, on obtient une liste de sites organisée par type d'information : serveurs, conférences, livres, journaux, répertoires, organismes ...
Les sites peuvent être des serveurs W3, Gopher, Telnet...

La seconde approche consiste à utiliser le formulaire de recherche (web search).
Un formulaire de Recherche Avancée Galaxy's advanced search permet entre autre de limiter une question à une catégorie. On entre un ou plusieurs termes, avec une troncature implicite ou explicite (*), combinés par un OU (any search term) ou un ET (all search terms).
On peut :


LookSmart

 taille : 1 200 000 URLs

 éditeurs : 150

 catégories : 24 000

LookSmart est un annuaire développé par LookSmart Ltd. et lancé en octobre 1996. Il se veut le rival de Yahoo. Il compte plus de 1 200 000 URLs rangés par 150 éditeurs dans une arborescence à plusieurs niveaux conduisant à 24 000 catégories. L'arborescence s'affiche à l'écran dans des colonnes de gauche à droite ce qui permet de mieux se rendre compte de son organisation.

 Recherche

Il est bien sûr possible de s'orienter dans la base des sites sélectionnés à partir de l'interrogation d'un index géré par le moteur d'AltaVista. On peut aussi interroger un index beaucoup plus large (30 millions de pages web et 4 millions d'articles de Newsgroups) . En fait c'est la base d'AltaVista sans la recherche avancée.

 Résultats

Les résultats issus du catalogue sont présentés avec une description rapide du site.


Lycos et Lycos France

 taille : sites

 éditeurs :

 catégories :

En Avril 99, Lycos a basculé du type moteur de recherche vers le type annuaire en utilisant l'Open Directory de Netscape. De fait, Lycos présente maintenant des résultats de recherche qui exploitent principalement le contenu de ses guides et celui du répertoire Open Directory. Lycos a été développé à l'Université Carnégie Mellon par Michael Mauldin et lancé en mai 1994. La société Lycos Inc., créée en juin 1995, améliore et commercialise le produit. En octobre 1998, Lycos a acheté Wired Digital (le moteur Hotbot, Hotwired, Wired News, Suck.com). HotBot continue séparement. Lycos Network regroupe les moteurs de recherche, Tripod (serveur web hébergeant des pages personnelles), Angelfire (email gratuites), de l'annuaire d'adresses WhoWhere et des sites de Wired Digital.
Lycos a une politique internationale active avec 11 versions nationales.

Chaque jour le logiciel explore l'Internet (serveurs W3, Gopher, FTP) et alimente une base de données. Lycos indexe le titre, les têtes de paragraphes (Hn), les 20 premières lignes et les 100 mots les plus fréquents d'un document, en ignorant les mots vides. Le fait de s'en tenir qu'une petite partie du texte peut conduire à une mauvaise indexation.
Il n'y a pas de vocabulaire contrôlé.

 Recherche

Lycos utilise un ou entre les termes par défaut.
On choisira de préférence Lycos Pro Search qui permet de préciser l'opérateur booléen de son choix : OR, AND et opérateur de proximité termes ordonés ou non.
La troncature est implicite.
Les mots vides de sens et trop fréquents de l'anglais sont filtrés. La recherche par phrase (proximité ou mots composés) correspond à The exact phrase.

Plusieurs limitations de la question sont proposées :

Enfin il est possible de pondérer les critères de tri des résultats :
Match all words.....      Close together...
Frequency of words...    Appear in title...
Near beginning of text...  In exact order...

 Résultats

La réponse est une liste d'adresses (URL) présentée dans un format très complet reprenant les 100 premiers mots.
Deux liens complètent le résumé : Similar Pages | More pages from .


Magellan

 taille : 60 000 sites

 éditeurs :

 catégories :

Magellan produit par le groupe McKinley, maintenant filiale de Excite, est disponible depuis août 1995. Ce répertoire propose 15 catégories, elles mêmes décomposées en sous-catégories.
Pour chaque site retenu, un spécialiste a écrit une brève description, donné des mots-clès et attribué une note illustrée par 1 à 4 étoiles. Un signal vert ( Magellan Green light) indique que le contenu du site peut être lu ou vu par tous les publics.
C'est donc un service à valeur ajoutée qui référence plus de 60 000 sites.

Le plus de Magellan est l'évaluation de chaque site par un comité de lecture comprenant des professionnels et des universitaires. La note attribuée tient compte de l'originalité du contenu, de sa présentation, de l'ergonomie et de la bonne mise à jour du service.

Cette évaluation est effectuée par un comité de lecture comprenant des professionnels et des universitaires. La note attribuée tient compte de l'originalité du contenu, de sa présentation, de l'ergonomie et de la bonne mise à jour du service.
Mais Magellan donne accès à un bien plus grand nombre de sites non évalués.

 Recherche

Un index permet d'interroger :


Par défaut le système fait un OU entre les termes. Il filtre les mots vides de sens et ne différencie pas les minuscules des majuscules.
On préférera la recherche avancée avec opérateurs booléens (AND, OR, AND NOT), recherche de mots composés entre guillemets et signes plus + ou moins -.

 Résultats

Le résultat est trié selon un critère de pertinence calculé en fonction de la présence des mots de la question.
Le format d'affichage est limité à un titre, les 3 premières lignes du document et l'URL.


NetGuide

 taille : 50 000 sites

 éditeurs :

 catégories :

NetGuide signale plus de 50 000 sites web classés dans 18 grandes catégories.
Ce catalogue semble orienté grand public avec une description approfondie des sites.

 Recherche

Il est possible d'interroger un index des descriptions des sites signalés. Le catalogue est complété par une base de données des articles en texte intégral de la société CMP.
Enfin une recherche sur le web reposant sur la technologie AltaVista est disponible.

Reference Shelf donne une liste impressionnante de ressources électroniques en dictionnaires, bibliothèques, ouvrages linguistiques, calendriers, unités de mesure


Open Directory

 taille : 472 638 sites

 éditeurs : 9 908

 catégories : 73 993

"Human is better" proclame cet annuaire proposé par Netscape.
Netscape a racheté l'annuaire contributif NewHoo! en novembre 98 pour offrir un nouveau répertoire de sites s'appuyant sur la bonne volonté d'éditeurs-utilisateurs bénévoles pour indéxer le Web; ils sont plus de 10 000 actuellement. Baptisé Open Source Directory (OSD), cet annuaire est intégré au réseau de sites Mozilla et utilisé depuis avril par Lycos.
L'objectif est de créer à terme le plus grand annuaire de sites du Web.

 Recherche

16 catégories principales

 Résultats

Netscape licencie aujourd'hui l'Open Source Directory à Lycos et Hotbot. Le projet d'open directory est désomais une collaboration entre Lycos, Mozilla.org et HotBot : "Help build the largest human-edited directory of the Web - Become an Editor".


Snap

 taille : 98 M de sites

 éditeurs :

 catégories :

Snap a été lancé fin 1997 par Cnet et NBC.
Il propose 16 catégories. C'est la technologie Inktomi qui est utilisée pour élargir les fonctions de recherche de son répertoire de sites.

 Recherche

Un bouton Advanced Search conduit à une page offrant de nombreuses options de recherche sous forme de menus déroulants.
On dispose des limites par langues (7), types de média, date et domaine.

L'absence de résultat dans l'annuaire conduit à l'affichage de pages issues de la base de données d'Inktomi.

 Résultats

Les résultats sont d'abord classés par catégories s'il y a lieu.


The Mining Company

 taille : sites

 éditeurs :

 catégories :

Lancé en 97, cet annuaire permet de retrouver des sites soit par des catégories, soit en interrogeant un index.
Mais il y a une réelle valeur ajoutée dans la mesure où chaque thème est dirigé par un animateur qui sélectionne les sites et rédige des guides, plus de 600, sur le sujet.

 Recherche

L'interrogation de l'index porte au choix :


Yahoo!

 taille : 1 200 000 sites

 éditeurs : 150

 catégories :

"Yet Another Hierarchically Organized Oracle"
C'est l'outil le plus ancien (début 94) et sans doute le plus connu de l'Internet. Développé à l'origine par deux étudiants de l'Université de Stanford, Jerry Yang et David Filo, pour leurs besoins propres, c'est devenu un produit industriel fin 94. La société est entrée en bourse en avril 96. Vous pouvez lire en français leur histoire.
Cependant la consultation est restée gratuite, les revenus provenant de bandeaux publicitaires qui s'affichent à l'écran à chaque interaction avec le serveur.

En septembre 1997, le traffic a atteint 50 millions de pages vues par jour pour 1 000 000 de sites retenus.
La société compte près de 400 employés en fin d'année. Depuis mi 96, Yahoo a régionalisé son activité aux Etats Unis avec Yahoo! Metros et dans le monde : 18 pays ont déjà leur propre Yahoo!. Cependant chaque site est indépendant et Yahoo.com n'est pas la somme des Yahoo régionaux.
La société diversifie aussi son offre avec par exemple un catalogue destiné aux jeunes Yahooligans! for Kids, des informations économiques, des espaces de discussion en direct (chat), l'offre d'une boite aux lettres électronique gratuite et même un centre d'assurance dans la section Yahoo Finance.
Yahoo vient de nouer une alliance avec Geocities, serveur hébergeant gratuitement des pages web

Chaque site signalé par Yahoo est visité, évalué et catégorisé parmi 25 000 thèmes avant d'être intégré dans la base de données. Environ 1000 sites sont ajoutés chaque jour. Yahoo signalait plus de 500 000 sites à la mi 97.

 Recherche

La première approche passe par les catégories organisées hiérarchiquement.
Mais il est plus simple d'interroger l'index des mots de ces catégories, des titres et résumés des sites retenus. Pour préciser un sujet il est judicieux de choisir une catégorie pour y poser sa question : attention choisir just this category.

L'interface de recherche est des plus simples : on entre le(s) terme(s) de sa question séparé par un espace.
Cependant pour une question complexe il est préférable d'aller dans advanced search pour préciser correctement la combinaison des termes et aussi choisir le nombre maximum de réponses (10, 25, 50, 100).

 Résultats

Les résultats sont présentés sous forme d'une liste des catégories et sous-catégories contenant le critère de recherche, plus une liste de sites. Un nouveau choix conduit au résultat définitif.
Une paire de lunettes indique un site recommandé.

Yahoo ne prétend pas à l'exhaustivité, aussi propose t'il de lancer la recherche sur d'autres outils depuis son serveur aux USA. Cela permet de compléter une recherche mais il y a risque de perdre en qualité dans la mesure où la question est lancée sans bénéficier de la syntaxe particulière à chaque service.

Bien que très connu, Yahoo présente de nombreux défauts car le travail humain est superficiel. En moyenne, chaque indexeur passe 2 minutes pour évaluer un site et le catégoriser (Le Monde).