J'ai téléchargé une implémentation en Python du fameux algorithme pagerank quoique je doute qu'il soit encore aussi simple, j'avais auparavant conçue le même algo en perl il fonctionne de façon itérative ce qui prend beaucoup de temps quand on lui envoie beaucoup de liens a traité. J'ai donc cherché si il n'y avait pas une implémentation utilisant des matrices afin d'aller plus vite et je suis tombé sur ceci Pagerank en python mon problème est que l'implémentation en python donne de faux résultats ou alors c'est moi qui me goure dans mes testes.
Mon algo en perl est basé sur les exemple fournit sur ce site http://www.iprcom.com/papers/pagerank/ dont les résultats sont correcte.
pour tester l'algo en python je lui ais envoyé une matrice correspondant a l'exemple 1 du site que j'ai cité précédemment soit :
une page A pointant vers deux pages B et C
la page B pointant sur C
la page C pointant sur A
et une page D pointant sur A
en perl j'obtiens ceci :
et en python en soumettant :a: 1.49011 b: 0.78330 c: 1.57660 d: 0.15000
Average pagerank = 1.0000
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5 [1, 2, 3], [2, 3], [3, 1], [4, 1], []
j'obtiens
[ 0.06060966 0.28105208 0.19722953 0.28105208 0.1800568 ]
Est ce la matrice que je fournit a l'algo en python qui est fausse ou l'algo qui est foireux ?
merci a vous
Partager