Bonjour,
Je suis en train d'implémenter un flame clustering. Cette implémentation se base sur ce que j'ai pu trouver sur internet, essentiellement ces deux liens :
- Wikipedia http://en.wikipedia.org/wiki/FLAME_clustering
- Cette implémentation en C (je code de mon coté en C#) : https://code.google.com/p/flame-clus...e/#svn%2Ftrunk
Dans l'ensemble, tout va bien, mais je souhaiterais avoir quelques conseils sur le forum :
- Calcul des distances :
Ca consomme beaucoup de mémoire et donc je souhaite limiter les données maintenues aux seuls plus proches voisins. Ca n'est pas un problème technique en soit, mais point suivant...
- Les k plus proches voisins :
Deux aspects ici.
Le premier : si deux voisins sont à même distance est-ce qu'ils ne comptent que pour 1 parmi les k ?
Le second : si la réponse à la question précédente est oui, je risque avoir tous les individus en tant que voisins en vis à vis de chaque individu (cela en fonction du problème traité)... et donc retomber sur le problème de consommation mémoire évoqué ci-dessus.
- L'itération :
Wikipedia indique deux choses :
Etapes 2.1.1 et 2.1.2 : "... with fixed and full ..."
Etape 2.2 : "Then the fuzzy memberships of all type 3 objects are updated by a converging iterative procedure called..."
Et le code C (si je l'ai bien décrypté) semble n'itérer que sur ce que wikipedia appelle "the rest".
Quelle est la bonne approche, dans la pratique ?
Merci de vos retours,
Partager