Il ne síagit pas de rechercher de líinformation
dans la célèbre encyclopédie mais dans un
annuaire de plus de 65 000 sites. Les sites retenus sont
classés en 14 catégories principales par une équipe
de 25 experts. Il s'agit avant tout de signaler le meilleur. Environ
15% des sites sont recommandés (*), moins de 1% sont jugés
exceptionnels (**) et environ 40 sont désignés les
meilleurs du web (***).
Recherche
On peut interroger un index des descriptions de ces sites.
Un formulaire Recherche Avancée permet de limiter sa recherche
soit par thèmes, soit par la note attribuée aux
sites par Britannica.
On peut aussi élargir la recherche à AltaVista.
Résultats
Líaffichage est limité au titre (lien vers
le site) et à deux lignes de texte.
Chaque site reçoit une évaluation : Noteworthy |
* Recommended | ** Exceptional | *** Best of the Web
Galaxy est un annuaire produit par America's Health Network (AHN Partners). Galaxy
est organisé en 11 grandes catégories, elles mêmes
découpées en un nombre variable de sous-catégories.
Recherche
En cliquant sur une catégorie ou une sous-catégorie,
on obtient une liste de sites organisée par type d'information
: serveurs, conférences, livres, journaux, répertoires,
organismes ...
Les sites peuvent être des serveurs W3, Gopher, Telnet...
La seconde approche consiste à utiliser le formulaire
de recherche (web search).
Un formulaire de Recherche Avancée Galaxy's advanced
search permet entre autre de limiter une question à
une catégorie. On entre un ou plusieurs termes, avec une
troncature implicite ou explicite (*), combinés par un
OU (any search term) ou un ET (all search terms).
On peut :
préciser une des 11 catégories ou effectuer
une recherche dans l'ensemble,
rechercher dans tout le texte ou limiter aux mots du titre
des services,
limiter aux serveurs W3 ou étendre aux serveurs Gopher
et Telnet (service Hytelnet).
LookSmart est un annuaire développé par LookSmart
Ltd. et lancé en octobre 1996. Il se veut le rival de Yahoo.
Il compte plus de 1 200 000 URLs rangés par 150 éditeurs
dans une arborescence à plusieurs niveaux conduisant à
24 000 catégories. L'arborescence s'affiche à
l'écran dans des colonnes de gauche à droite ce
qui permet de mieux se rendre compte de son organisation.
Recherche
Il est bien sûr possible de s'orienter dans la base
des sites sélectionnés à partir de l'interrogation
d'un index géré par le moteur d'AltaVista. On peut
aussi interroger un index beaucoup plus large (30 millions de
pages web et 4 millions d'articles de Newsgroups) . En fait c'est
la base d'AltaVista sans la recherche avancée.
Résultats
Les résultats issus du catalogue sont présentés
avec une description rapide du site.
En Avril 99, Lycos a basculé du type moteur de recherche
vers le type annuaire en utilisant l'Open Directory de Netscape.
De fait, Lycos présente maintenant des résultats
de recherche qui exploitent principalement le contenu de ses guides
et celui du répertoire Open Directory. Lycos a été
développé à l'Université Carnégie
Mellon par Michael Mauldin et lancé en mai 1994. La société
Lycos Inc., créée en juin 1995, améliore
et commercialise le produit. En octobre 1998, Lycos a acheté
Wired Digital (le moteur Hotbot, Hotwired, Wired News, Suck.com).
HotBot continue séparement. Lycos Network regroupe les moteurs de recherche,
Tripod (serveur web hébergeant des pages personnelles),
Angelfire (email gratuites), de l'annuaire d'adresses WhoWhere
et des sites de Wired Digital.
Lycos a une politique internationale active avec 11 versions nationales.
Chaque jour le logiciel explore l'Internet (serveurs W3, Gopher,
FTP) et alimente une base de données. Lycos indexe le titre,
les têtes de paragraphes (Hn), les 20 premières lignes
et les 100 mots les plus fréquents d'un document, en ignorant
les mots vides. Le fait de s'en tenir qu'une petite partie du
texte peut conduire à une mauvaise indexation.
Il n'y a pas de vocabulaire contrôlé.
Recherche
Lycos utilise un ou entre les termes par défaut.
On choisira de préférence Lycos Pro Search qui permet de préciser
l'opérateur booléen de son choix : OR, AND et opérateur
de proximité termes ordonés ou non.
La troncature est implicite.
Les mots vides de sens et trop fréquents de l'anglais sont
filtrés. La recherche par phrase (proximité ou mots
composés) correspond à The exact phrase.
Plusieurs limitations de la question sont proposées
:
le nombre maximum de réponses : de 10 à 40
le type de données recherchées : logiciels,
sons, images, dictionnaires ...
sur tout ou partie des documents
parmi 15 langues
Enfin il est possible de pondérer les critères
de tri des résultats :
Match all words..... Close
together...
Frequency of words... Appear in title...
Near beginning of text... In exact order...
Résultats
La réponse est une liste d'adresses (URL) présentée
dans un format très complet reprenant les 100 premiers
mots.
Deux liens complètent le résumé : Similar
Pages | More pages from .
Magellan produit par le groupe McKinley, maintenant filiale
de Excite, est disponible depuis août 1995. Ce répertoire
propose 15 catégories, elles mêmes décomposées
en sous-catégories.
Pour chaque site retenu, un spécialiste a écrit
une brève description, donné des mots-clès
et attribué une note illustrée par 1 à 4
étoiles. Un signal vert ( Magellan Green light) indique
que le contenu du site peut être lu ou vu par tous les publics.
C'est donc un service à valeur ajoutée qui référence
plus de 60 000 sites.
Le plus de Magellan est l'évaluation de chaque site
par un comité de lecture comprenant des professionnels
et des universitaires. La note attribuée tient compte de
l'originalité du contenu, de sa présentation, de
l'ergonomie et de la bonne mise à jour du service.
Cette évaluation est effectuée par un comité
de lecture comprenant des professionnels et des universitaires.
La note attribuée tient compte de l'originalité
du contenu, de sa présentation, de l'ergonomie et de la
bonne mise à jour du service.
Mais Magellan donne accès à un bien plus grand nombre
de sites non évalués.
Recherche
Un index permet d'interroger :
soit la base complète The Entire Web,
soit la base des sites évalués Reviewed
Sites Only,
soit les sites verts Green Light sites only.
Par défaut le système fait un OU entre les termes.
Il filtre les mots vides de sens et ne différencie pas
les minuscules des majuscules.
On préférera la recherche avancée avec opérateurs
booléens (AND, OR, AND NOT), recherche de mots composés
entre guillemets et signes plus + ou moins -.
Résultats
Le résultat est trié selon un critère
de pertinence calculé en fonction de la présence
des mots de la question.
Le format d'affichage est limité à un titre, les
3 premières lignes du document et l'URL.
NetGuide signale plus de 50 000 sites web classés dans
18 grandes catégories.
Ce catalogue semble orienté grand public avec une description
approfondie des sites.
Recherche
Il est possible d'interroger un index des descriptions
des sites signalés. Le catalogue est complété
par une base de données des articles en texte intégral
de la société CMP.
Enfin une recherche sur le web reposant sur la technologie AltaVista
est disponible.
Reference Shelf donne une liste impressionnante de ressources
électroniques en dictionnaires, bibliothèques, ouvrages
linguistiques, calendriers, unités de mesure
"Human is better" proclame cet annuaire proposé
par Netscape.
Netscape a racheté l'annuaire contributif NewHoo! en novembre
98 pour offrir un nouveau répertoire de sites s'appuyant
sur la bonne volonté d'éditeurs-utilisateurs bénévoles
pour indéxer le Web; ils sont plus de 10 000 actuellement.
Baptisé Open Source Directory (OSD), cet annuaire
est intégré au réseau de sites Mozilla et
utilisé depuis avril par Lycos.
L'objectif est de créer à terme le plus grand annuaire
de sites du Web.
Recherche
16 catégories principales
Résultats
Netscape licencie aujourd'hui l'Open Source Directory
à Lycos et Hotbot. Le projet d'open directory est désomais
une collaboration entre Lycos, Mozilla.org et HotBot : "Help
build the largest human-edited directory of the Web - Become an
Editor".
Snap a été lancé fin 1997 par Cnet
et NBC.
Il propose 16 catégories. C'est la technologie Inktomi
qui est utilisée pour élargir les fonctions de recherche
de son répertoire de sites.
Recherche
Un bouton Advanced Search conduit à une page
offrant de nombreuses options de recherche sous forme de menus
déroulants.
On dispose des limites par langues (7), types de média,
date et domaine.
L'absence de résultat dans l'annuaire conduit à
l'affichage de pages issues de la base de données d'Inktomi.
Résultats
Les résultats sont d'abord classés par catégories
s'il y a lieu.
Lancé en 97, cet annuaire permet de retrouver des sites
soit par des catégories, soit en interrogeant un index.
Mais il y a une réelle valeur ajoutée dans la mesure
où chaque thème est dirigé par un animateur
qui sélectionne les sites et rédige des guides,
plus de 600, sur le sujet.
Recherche
L'interrogation de l'index porte au choix :
sur les sélections de la société
sur tout l'Internet par l'intermédiaire d'AltaVista
"Yet Another Hierarchically Organized Oracle"
C'est l'outil le plus ancien (début 94) et sans doute le
plus connu de l'Internet. Développé à l'origine
par deux étudiants de l'Université de Stanford,
Jerry Yang et David Filo, pour leurs besoins propres, c'est devenu
un produit industriel fin 94. La société est entrée
en bourse en avril 96. Vous pouvez lire en français leur
histoire.
Cependant la consultation est restée gratuite, les revenus
provenant de bandeaux publicitaires qui s'affichent à l'écran
à chaque interaction avec le serveur.
En septembre 1997, le traffic a atteint 50 millions de pages
vues par jour pour 1 000 000 de sites retenus.
La société compte près de 400 employés
en fin d'année. Depuis mi 96, Yahoo a régionalisé
son activité aux Etats Unis avec Yahoo! Metros et dans
le monde : 18 pays ont déjà leur propre Yahoo!.
Cependant chaque site est indépendant et Yahoo.com n'est
pas la somme des Yahoo régionaux.
La société diversifie aussi son offre avec par exemple
un catalogue destiné aux jeunes Yahooligans! for Kids,
des informations économiques, des espaces de discussion
en direct (chat), l'offre d'une boite aux lettres électronique
gratuite et même un centre d'assurance dans la section Yahoo
Finance.
Yahoo vient de nouer une alliance avec Geocities, serveur hébergeant
gratuitement des pages web
Chaque site signalé par Yahoo est visité, évalué
et catégorisé parmi 25 000 thèmes avant
d'être intégré dans la base de données.
Environ 1000 sites sont ajoutés chaque jour. Yahoo signalait
plus de 500 000 sites à la mi 97.
Recherche
La première approche passe par les catégories
organisées hiérarchiquement.
Mais il est plus simple d'interroger l'index des mots de ces catégories,
des titres et résumés des sites retenus. Pour préciser
un sujet il est judicieux de choisir une catégorie pour
y poser sa question : attention choisir just this category.
L'interface de recherche est des plus simples : on entre le(s)
terme(s) de sa question séparé par un espace.
Cependant pour une question complexe il est préférable
d'aller dans advanced search pour préciser correctement
la combinaison des termes et aussi choisir le nombre maximum de
réponses (10, 25, 50, 100).
Résultats
Les résultats sont présentés sous
forme d'une liste des catégories et sous-catégories
contenant le critère de recherche, plus une liste de sites.
Un nouveau choix conduit au résultat définitif.
Une paire de lunettes indique un site recommandé.
Yahoo ne prétend pas à l'exhaustivité,
aussi propose t'il de lancer la recherche sur d'autres outils
depuis son serveur aux USA. Cela permet de compléter une
recherche mais il y a risque de perdre en qualité dans
la mesure où la question est lancée sans bénéficier
de la syntaxe particulière à chaque service.
Bien que très connu, Yahoo présente de nombreux
défauts car le travail humain est superficiel. En moyenne,
chaque indexeur passe 2 minutes pour évaluer un site et
le catégoriser (Le Monde).