l'information circule dans l'entreprise, je l'ai souvent croisée devant la ... machine à café

Translation

Powered by Google

2007 : l'odyssée de Wikiasari


2006 s'est achevée sur une question : existe t-il des alternatives au moteur de recherche Google ?

2007 pourrait bien apportée un début de réponse. Dernière annonce faite dans le registre des acteurs qui veulent venir jouer dans la cour de la firme de Mountain View : celle de Jimmy Wales et c'est dans The Times daté du 23 décembre dernier. Jimmy Wales, c'est le créateur de la Success Storie du Web 2.0 : l'encyclopédie en ligne Wikipédia (1)

Où il est dit que google est de par son principe de fonctionnement limité en terme de pertinence des résultats remontés. L'algorithme repose sur le calcul de la popularité d'un site à partir des liens qui pointent vers lui (PageRank). Comprendre : plus de liens pointent vers un site, plus celui-ci est réputé populaire, plus son PageRank est élevé, plus ses chances d'apparaître en tête des résultats sont grandes ; le but du jeu étant d'appaître en haut de liste (si vous souhaitez savoir pourquoi ? c'est écrit là

Le problème que soulève J. Wales, c'est que les automates qui effectuent ces calculs de popularité ne sont pas capables de faire la distinction entre les liens "naturels" et ceux qui relèvent d'une activité humaine pour détourner une audience ou encore pour accroitre artificiellement une popularité (on citera à titre d'exemple la technique du Google Bombing ou encore l'épisode de la mise en quarantaine du site d'un constructeur automobile pour abus).

Bref, là où la machine trouve ses limites, l'intervention humaine est indispensable pour venir compléter (plus précisément affiner) la recherche. C'est un appel à la communauté des wikipedians (contributeurs de l'encyclopédie) pour valider les résultats remontés par la recherche algorithmique. Pour ce, d'après J. Wales, quelques secondes suffisent à l'intelligence humaine pour qualifier un résultat de pertinent ou non et le proposer en retour au netchercheur. On peut résumer ainsi : un moteur ne doit pas se limiter à la remonter de résultats mais doit analyser ces retours et les trier pour ne servir que les plus pertinents.

Le modèle économique retenu par JW est celui de la vente d'espaces publicitaires. Les éléments de différenciation avancés sont ceux de la notoriété acquise par la communauté des contributeurs / utilisateurs de Wikipedia, de la transparence des outils (open source) et au final de la confiance que les netchercheurs ne manqueront pas de manifester à l'égard du futur moteur. Amazon serait partie prenante au projet.

Commentaires : l'idée paraît séduisante, ne serait ce que parce qu'un moteur qui remonte des millions de résultats pour une requête donnée produit un effet de suspiscion. Il est certain que pour des requêtes élaborées, les moteurs classiques perdent en pertinence. Maintenant, l'intervention humaine va induire inévitablement la question de la compréhension et au final celui de la subjectivité ou du système référant de celui qui va analyser et trier les résultats. C'est émettre l'hypothèse qu'une même question peut être interprétée différemment selon la personne qui l'analyse, qu'en sera t-il des homonymies et autres subtilités de langage ?

C'est aussi admettre que les moteurs "généralistes" ne couvrent qu'une partie réputée "visible" du web et qu'ils n'ont pas accès à des données profondes plus porteuses de pertinence (tout du moins dans un usage professionnel ou académique). A priori, le projet ne devrait pas se démarquer de ses concurrents sur ce point.

A suivre ... lancement prévu : courant du 1er trimestre 2007

Nom de code : Wikiasari (si vous souhaitez en connaître la signification c'est dans l'article du Times)

Pour compléter l'information :

La rubrique : moteurs de recherche

La rubrique : la vie en Google


Source de l'info : DSI Le carnet des sites de  recherche (avec des compléments d'information sur la technologie envisagée)

__________________________________________________
(1) environ 350 millions de visiteurs par mois, soit une présence dans le top 10 des sites les plus visités dans le monde

Rédigé par la machine à café le 03/01/2007 à 10:34 | Commentaires (0) | Permalien | Trackbacks (0)

Facebook Google + Twitter LinkedIn Del.icio.us Google Furl Y! Technorati Viadeo Pinterest
Syndication
RSS ATOM RSS comment PODCAST Mobile

Add to Netvibes

Abonnement Bloglines

Add to Google

/a_la_une

Subscribe in NewsGator Online



Vous n'utilisez pas d'agrégateur de flux RSS Vous pouvez recevoir - dès parution - les billets de ce weblog sur votre outil de messagerie en vous inscrivant ci-dessous


entrez votre adresse e-mail :