l'information circule dans l'entreprise, je l'ai souvent croisée devant la ... machine à café

Translation

Powered by Google


C'a commence par un thème inépuisable : "le paradoxe de l'information" que l'on peut résumer par "je cherche, mais ne trouve pas". C'est aussi tenter de trouver la bonne information dans une masse de données qui croît de façon exponentielle. Pas de doute l'information existe, elle doit bien être indexée quelque part sur le net et la façon, a priori, la plus sure d'y parvenir est par la formulation d'une requête depuis un moteur de recherche.

On en arrive à la firme de Mountain View qui a fait sa fortune sur le développement de son algorithme de recherche calculé suivant l'indice de popularité (PageRank) des pages web. Depuis, le célèbre moteur a connu quelques déclinaisons sur notamment les périmètres de la recherche (finance, brevets US, etc...), de même que sur les fonctionnalités (Customsearch.

Voici un projet(1) développé par un ingénieur russe qui pose comme principe la gestion de la formulation de la requête et de sa catégorisation appliquée au moteur Google.

                                                Newisearch

Nom de code : Google hack search explorer

L'idée est de classer les résultats remontés par le moteur de recherche suivant des sens possibles. C'est la principe de la clusterisation qui sur la base d'un mot clé permet de naviguer depuis la même interface dans des univers sémantiques différents. A titre d'exemple : une recherche sur le terme "intelligence" permet de remonter un ensemble de résultats propre à "l'intelligence articficielle", mais aussi de naviguer dans un corpus de liens qui traitent de la communauté du renseignement.

Le principe propose à une requête donnée l'association de mots clés. L'internaute peut alors choisir un second niveau de recherche en entrant dans l'univers de sens du mot clé sélectionné. Idéal pour gérer les termes à sens multiples.

L'un des avantages du moteur est, par ailleurs, la possibilité de formuler une requête en langage naturel. Pour cela, l'application qui catégorise les résultats repose sur le principe de l'auto-apprentissage pour constituer une base de connaissances dans laquelle iront puiser les requêtes plus ou moins complexes.

On se souvient de l'initiative en 2005 Google Answers (voir le billet Yahoo répond à Google dans le domaine des services d'intermédiation de questions/réponses. Mais derrière le moteur, il y avait alors le facteur humain qui traitait la demande. Depuis Google Answers a disparu, pas son concurrent.

Si l'objectif du développeur à l'initiative de cet outil est à viser académique, on se prend à rêver d'un projet qui vise à produire une interface de recherche "intelligente".

_____________________________________
Ressources :

l'infobésité, une pandémie à traiter

Sur l'utilisation des moteurs de recherche "Chercher, c'est trouver !"

source de l'info : Testing Search Explorer, a clustering Google hack (Pandia)

et comme Noël approche, sachez qu'il est possible de télécharger le plug-in Search Explorer pour intégrer l'application dans la barre de navigation au niveau des moteurs de recherche

(1) je n'ai pas réussi à dater l'origine du programme, mais je suis remontée à une mention du terme Newisearch de novembre 2006

Rédigé par ludovic bour le 22/12/2007 à 22:52 | Commentaires (0) | Permalien

Facebook Google + Twitter LinkedIn Del.icio.us Google Furl Y! Technorati Viadeo Pinterest

Nouveau commentaire :

Syndication
RSS ATOM RSS comment PODCAST Mobile

Add to Netvibes

Abonnement Bloglines

Add to Google

/a_la_une

Subscribe in NewsGator Online



Vous n'utilisez pas d'agrégateur de flux RSS Vous pouvez recevoir - dès parution - les billets de ce weblog sur votre outil de messagerie en vous inscrivant ci-dessous


entrez votre adresse e-mail :