slt à tous,
je cherche une méthode pour éviter le choix (initial) au hasard des représentants(centres de gravité||noyaux) des classes dans les algos de la classification non hiérarchique (K-means||Forgy|| nuées dynamique)
merci d'avance.
Version imprimable
slt à tous,
je cherche une méthode pour éviter le choix (initial) au hasard des représentants(centres de gravité||noyaux) des classes dans les algos de la classification non hiérarchique (K-means||Forgy|| nuées dynamique)
merci d'avance.
Bonjour,
Voilà deux pistes :
- Je sais que SAS/JMP utilise un algorithme "intelligent" d'initialisation, mais je ne sais pas lequel. C'est une piste que je te conseille de creuser.
- Tu peux faire un calcul des formes fortes afin d'initialiser ton k-means.
bonjour TOTO13,
merci pour la réponse mais :
SAS/JMP??? c'est un logiciel ?
on obtient les formes fortes on répétant l'algorithme plusieurs fois??? n'est ce pas?
donc on a tjrs le problème d'initialisation???
Bonsoir,
Oui, SAS est un logiciel de statistiques/Data Mining très répandu.
JMP est sa version graphique pour Mac OS X.
Tu dois pouvoir trouver la méthode utilisée pour l'initialisation :)
Alors pour les calculer les formes fortes (c'est pas facile à expliquer) :
- Tu calcules plusieurs fois ton KMeans, disons trois fois.
- Tu regardes quels individus appartiennent souvent à la même classe.
- Ces groupes d'individus constituent les formes fortes.
- Tu calcules le barycentre de ces formes fortes.
- Tu utilises ces barycentres pour initialiser le dernier KMeans qui convergera beaucoup plus vite vers la solution.
Les formes fortes sont une initialisation intelligente des KMeans.
Voilà un exemple simple constitué des six individu n'ayant qu'une seule caractéristiques :
On fait deux KMeans avec deux classes et on obtiens la répartition suivante pour les classes d'appartenances :Citation:
I1(0)
I2(1)
I3(2)
I4(3)
I5(4)
I6(5)
Donc si on cherche deux formes fortes, on va trouver les combinaisons d'appartenance suivantes : (1 2) trois individus, (2 2) un individu, (2 1) deux individus.Citation:
KMeans 1 => 1 1 1 2 2 2
KMeans 2 => 2 2 2 2 1 1 (et oui, ce cas est possible)
Donc les deux formes fortes gagnantes sont : (1 2) et (2 1).
Donc on va initialiser le dernier KMeans avec le barycentre de (I1 I2 I3) et (I5 I6).