l'information circule dans l'entreprise, je l'ai souvent croisée devant la ... machine à café


Translation

Powered by Google

Une histoire de moteurs ... et du web
 
A l'heure où le concept de web 2.0 irrigue l'actualité des TIC, voilà un dossier de fonds réalisé à l'initiative d'un SEO (Search Engine Optimizer) qui nous retrace l'histoire des moteurs de recherche depuis la fin de la 2nd guerre mondial à l'ère Google.
 
Tout d'abord SEO, c'est quoi ? C'est - je cite le consultant en question - l'art et la science d'éditer des informations et de les présenter de façon à les rendre compréhensibles du point de vue des moteurs de recherche suivant les pratiques (en terme de requêtage) constatées sur ces moteurs. Dit autrement, cela revient à optimiser - du point de vue de l'éditeur de contenu - le référencement, l'indexation, l'architecture de restitution des données, etc ...  Bref, partir des usages et  non plus seulement des capacités techniques de ces moteurs pour organiser l'information et la rendre intelligible par ces moteurs. A partir de là, la "toile" s'organise.

Pour quoi s'intéresser à une histoire des moteurs de recherche à l'heure où les projecteurs se focalisent sur le web collaboratif (c'est dit plus haut sous le vocable Web 2.0) ? Parce que (il est bon de le rappeler) l'accès au contenu se fait dans une large mesure par l'intermédiaire des moteurs de recherche. Comprendre l'évolution des moteurs de recherche, c'est en observer les pratiques et au final optimiser leur utilisation.

L'histoire en question se décline comme un voyage dans le temps : soit un avant et un après sauf que le sigle a changé (JC est devenu WWW). Pour résumer, au lendemain de la 2nd guerre mondiale, la communauté scientifique est invitée à construire un corpus de savoirs et de connaissances pour le bénéfice de l'Humanité. De là part l'idée d'organiser une gigantesque mémoire stockée dans un système appelé Memex (sorte de système hypertexte avant l'heure). Puis vint une théorie de l'indexation pour organiser cette mémoire. Nous voilà déjà dans les années 60 avec l'apparition du concept d'hypertexte dans le cadre du Projet Xanadu (comme la résidence de Charles Foster Kane dans le film Citizen Kane) qui bien que resté au stade d'utopie prévoyait un vaste réseau d'ordinateurs interconnectés et communiquant entre eux pour échanger des données. Nous voilà déjà en 1972 et ARPANet avance le principe de transfert de paquets pour l'échange de données.

L'histoire s'accèlère avec le développement du protocole de transfert de données FTP et au final l'avènement du World Wide Web (le premier site internet, c'était le 6 août 1991). Le web, c'est un protocole de communication qui rencontre un système contenant des documents liés entre eux par des hyperliens pour passer automatiquement d'un document à un autre via une interface (aujourd'hui simple) proposée par les navigateurs.

Devant la masse de données ainsi créée, il n'en fallait pas davantage pour voir émerger rapidement une logique de classification dans des catalogues ou directories et donc d'indexation.

Bien, après cette longue parenthèse, on en arrive à ce que sont les moteurs de recherche devenus. Où il est dit que les moteurs utilisent des araignées "spiders" (plus précisément des robots qui effectuent des taches répétitives à l'infini) qui parcourent la toile pour en lire le contenu, l'indexent dans des catalogues et répertoires, enregistrent les liens. On trouve donc dans un moteur des robots, un index (catalogue) et une interface de recherche.

Une fois posé ce principe qui structure un moteur, vient la question de la restitution des données (résultats) et plus précisémment de l'ordre de remontée de ces résultats. Soit le principe discriminant qui permet au dit morteur de classer dans un ordre donné les retours.

Après je vous laisse l'initiative de poursuivre la lecture de ce dossier passionnant directement à la source et de retrouver quelques gloires éphémères de la toile tout ceci concentré sur une période qui n'excède pas 15 ans. C'est aussi se remettre dans l'actualité présente des outils de recherche et d'indexation au travers de la question du droit de reproduction des données tierces, des nouvelles tendances du web collaboratif appliquées aux moteurs de recherche.

Le dossier complet : History of Search Engines : from 1945 to Google 2006

Pour le plaisir de (re)découvrir la première interface de recherche proposée par Google

Pour compléter l'information :
  1. un billet paru en juin 2006 sur 2 études sur le comportement des internautes qui utilisent les moteurs
  2. la rubrique moteurs de recherche de ce site
Au fait, aviez vous remarqué que ce site propose ...
... 2 moteurs de recherche

Rédigé par La machine à café le 23/11/2006 à 22:39 | Commentaires (0) | Permalien

Facebook Google + Twitter LinkedIn Del.icio.us Google Furl Y! Technorati Viadeo Pinterest

Nouveau commentaire :

Syndication
RSS ATOM RSS comment PODCAST Mobile

Add to Netvibes

Abonnement Bloglines

Add to Google

/a_la_une

Subscribe in NewsGator Online



Vous n'utilisez pas d'agrégateur de flux RSS Vous pouvez recevoir - dès parution - les billets de ce weblog sur votre outil de messagerie en vous inscrivant ci-dessous


entrez votre adresse e-mail :