Autres billets
Tags
seo montre conf tempusFugit client metrique recsys spam Université vente airweb formation ref Porno ROI split test algo captcha divers horloge Job math nul PPC produit projet psycho pub relation client reputation sem sensing twitter
Blogroll
Cher lecteur, tu t'intéresses aux moteurs de recherche, donc tu sais que la plupart des moteurs (en tout cas au moins celui qui est ton préféré) effectuent deux tâches distinctes : l'analyse de la pertinence et le classement des pages entre elles. Pour la deuxième tâche l'algorithme le plus connu est probablement le PageRank de Google, dont je parlerais un autre jour.
Bref, revenons à l'analyse de la pertinence d'une page (=un document) par rapport à un requête. En 1968, Gerard Salton (1927-1995, professeur à l'Université de Cornell, pionnier de l'Information Retrieval) présente pour la première fois le modèle vectoriel. Son hypothèse est que les fréquences d'occurrences des termes d'un texte donnent une bonne représentation du contenu du texte.
La suite : http://www.spoonylife.org/algorithms-and-computation/modele-vectoriel-et-cosinus-de-salton
Réactions
Bien joué, ça se comprend assez facilement de cette façon 
heureusement que tu es là pour nous aider à comprendre tout ça ! surtout quand on n'est pas matheux ...mais cette explication est lumineuse !
Merci pour l explication.
Tres instructif.
Bonjour et merci SYP,
Belle démonstration. C'est tellement difficile de faire simple. Félicitations.
Amitiés,
Michel
code antispam : KIFE (C'est tout à fait ça ! ) 
Dommage, je trouvais la requête plus proche du texte 2... :-\