taille : 65 000 sites |
éditeurs : 25 |
catégories : |
Il ne síagit pas de rechercher de líinformation dans la célèbre encyclopédie mais dans un annuaire de plus de 65 000 sites. Les sites retenus sont classés en 14 catégories principales par une équipe de 25 experts. Il s'agit avant tout de signaler le meilleur. Environ 15% des sites sont recommandés (*), moins de 1% sont jugés exceptionnels (**) et environ 40 sont désignés les meilleurs du web (***).
Recherche |
On peut aussi élargir la recherche à AltaVista.
Résultats |
taille : sites |
éditeurs : |
catégories : |
Galaxy est un annuaire produit par America's Health Network (AHN Partners). Galaxy est organisé en 11 grandes catégories, elles mêmes découpées en un nombre variable de sous-catégories.
Recherche |
La seconde approche consiste à utiliser le formulaire de
recherche (web search).
Un formulaire de Recherche Avancée Galaxy's advanced
search permet entre autre de limiter une question à une
catégorie. On entre un ou plusieurs termes, avec une
troncature implicite ou explicite (*), combinés par un OU (any
search term) ou un ET (all search terms).
On peut :
taille : 1 200 000 URLs |
éditeurs : 150 |
catégories : 24 000 |
LookSmart est un annuaire développé par LookSmart Ltd. et lancé en octobre 1996. Il se veut le rival de Yahoo. Il compte plus de 1 200 000 URLs rangés par 150 éditeurs dans une arborescence à plusieurs niveaux conduisant à 24 000 catégories. L'arborescence s'affiche à l'écran dans des colonnes de gauche à droite ce qui permet de mieux se rendre compte de son organisation.
Recherche |
Résultats |
taille : sites |
éditeurs : |
catégories : |
En Avril 99, Lycos a basculé du type moteur de recherche
vers le type annuaire en utilisant l'Open Directory de Netscape.
De fait, Lycos présente maintenant des résultats de
recherche qui exploitent principalement le contenu de ses guides et
celui du répertoire Open Directory. Lycos a été
développé à l'Université Carnégie
Mellon par Michael Mauldin et lancé en mai 1994. La
société Lycos Inc., créée en juin 1995,
améliore et commercialise le produit. En octobre 1998, Lycos a
acheté Wired Digital (le moteur Hotbot, Hotwired, Wired News,
Suck.com). HotBot continue séparement.
Lycos
Network regroupe les moteurs de recherche, Tripod (serveur web
hébergeant des pages personnelles), Angelfire (email
gratuites), de l'annuaire d'adresses WhoWhere et des sites de Wired
Digital.
Lycos a une politique internationale active avec 11 versions
nationales.
Chaque jour le logiciel explore l'Internet (serveurs W3, Gopher,
FTP) et alimente une base de données. Lycos indexe le titre,
les têtes de paragraphes (Hn), les 20 premières lignes
et les 100 mots les plus fréquents d'un document, en ignorant
les mots vides. Le fait de s'en tenir qu'une petite partie du texte
peut conduire à une mauvaise indexation.
Il n'y a pas de vocabulaire contrôlé.
Recherche |
Plusieurs limitations de la question sont proposées :
Enfin il est possible de pondérer les critères de
tri des résultats :
Match all words..... Close
together...
Frequency of words... Appear in title...
Near beginning of text... In exact order...
Résultats |
taille : 60 000 sites |
éditeurs : |
catégories : |
Magellan produit par le groupe McKinley, maintenant filiale de
Excite, est disponible depuis août 1995. Ce répertoire
propose 15 catégories, elles mêmes
décomposées en sous-catégories.
Pour chaque site retenu, un spécialiste a écrit une
brève description, donné des mots-clès et
attribué une note illustrée par 1 à 4
étoiles. Un signal vert ( Magellan Green light) indique que le
contenu du site peut être lu ou vu par tous les publics.
C'est donc un service à valeur ajoutée qui
référence plus de 60 000 sites.
Le plus de Magellan est l'évaluation de chaque site par un comité de lecture comprenant des professionnels et des universitaires. La note attribuée tient compte de l'originalité du contenu, de sa présentation, de l'ergonomie et de la bonne mise à jour du service.
Cette évaluation est effectuée par un comité
de lecture comprenant des professionnels et des universitaires. La
note attribuée tient compte de l'originalité du
contenu, de sa présentation, de l'ergonomie et de la bonne
mise à jour du service.
Mais Magellan donne accès à un bien plus grand nombre
de sites non évalués.
Recherche |
Par défaut le système fait un OU entre les termes. Il
filtre les mots vides de sens et ne différencie pas les
minuscules des majuscules.
On préférera la recherche avancée avec
opérateurs booléens (AND, OR, AND NOT), recherche de
mots composés entre guillemets et signes plus + ou moins -.
Résultats |
taille : 50 000 sites |
éditeurs : |
catégories : |
NetGuide signale plus de 50 000 sites web classés dans 18
grandes catégories.
Ce catalogue semble orienté grand public avec une description
approfondie des sites.
Recherche |
Reference Shelf donne une liste impressionnante de ressources électroniques en dictionnaires, bibliothèques, ouvrages linguistiques, calendriers, unités de mesure
taille : 472 638 sites |
éditeurs : 9 908 |
catégories : 73 993 |
"Human is better" proclame cet annuaire proposé par
Netscape.
Netscape a racheté l'annuaire contributif NewHoo! en novembre
98 pour offrir un nouveau répertoire de sites s'appuyant sur
la bonne volonté d'éditeurs-utilisateurs
bénévoles pour indéxer le Web; ils sont plus de
10 000 actuellement. Baptisé Open Source Directory
(OSD), cet annuaire est intégré au réseau de
sites Mozilla et utilisé depuis avril par Lycos.
L'objectif est de créer à terme le plus grand annuaire
de sites du Web.
Recherche |
Résultats |
taille : 98 M de sites |
éditeurs : |
catégories : |
Recherche |
L'absence de résultat dans l'annuaire conduit à l'affichage de pages issues de la base de données d'Inktomi.
Résultats |
taille : sites |
éditeurs : |
catégories : |
Lancé en 97, cet annuaire permet de retrouver des sites
soit par des catégories, soit en interrogeant un index.
Mais il y a une réelle valeur ajoutée dans la mesure
où chaque thème est dirigé par un animateur qui
sélectionne les sites et rédige des guides, plus
de 600, sur le sujet.
Recherche |
taille : 1 200 000 sites |
éditeurs : 150 |
catégories : |
"Yet Another Hierarchically Organized Oracle"
C'est l'outil le plus ancien (début 94) et sans doute le plus
connu de l'Internet. Développé à l'origine par
deux étudiants de l'Université de Stanford, Jerry Yang
et David Filo, pour leurs besoins propres, c'est devenu un produit
industriel fin 94. La société est entrée en
bourse en avril 96. Vous pouvez lire en français leur
histoire.
Cependant la consultation est restée gratuite, les revenus
provenant de bandeaux publicitaires qui s'affichent à
l'écran à chaque interaction avec le serveur.
En septembre 1997, le traffic a atteint 50 millions de pages vues
par jour pour 1 000 000 de sites retenus.
La société compte près de 400 employés en
fin d'année. Depuis mi 96, Yahoo a régionalisé
son activité aux Etats Unis avec Yahoo! Metros et dans le
monde : 18 pays ont déjà leur propre Yahoo!. Cependant
chaque site est indépendant et Yahoo.com n'est pas la somme
des Yahoo régionaux.
La société diversifie aussi son offre avec par exemple
un catalogue destiné aux jeunes Yahooligans! for Kids,
des informations économiques, des espaces de discussion en
direct (chat), l'offre d'une boite aux lettres électronique
gratuite et même un centre d'assurance dans la section Yahoo
Finance.
Yahoo vient de nouer une alliance avec Geocities, serveur
hébergeant gratuitement des pages web
Chaque site signalé par Yahoo est visité, évalué et catégorisé parmi 25 000 thèmes avant d'être intégré dans la base de données. Environ 1000 sites sont ajoutés chaque jour. Yahoo signalait plus de 500 000 sites à la mi 97.
Recherche |
L'interface de recherche est des plus simples : on entre le(s)
terme(s) de sa question séparé par un espace.
Cependant pour une question complexe il est préférable
d'aller dans advanced search pour préciser correctement
la combinaison des termes et aussi choisir le nombre maximum de
réponses (10, 25, 50, 100).
Résultats |
Yahoo ne prétend pas à l'exhaustivité, aussi propose t'il de lancer la recherche sur d'autres outils depuis son serveur aux USA. Cela permet de compléter une recherche mais il y a risque de perdre en qualité dans la mesure où la question est lancée sans bénéficier de la syntaxe particulière à chaque service.
Bien que très connu, Yahoo présente de nombreux défauts car le travail humain est superficiel. En moyenne, chaque indexeur passe 2 minutes pour évaluer un site et le catégoriser (Le Monde).