Bonjour
Dans le cadre d'un projet personnel je suis amené à trouver un algorithme de classification sur une population d'environ 10 000 individus suivant environ 20 critères pour former des groupes homogènes d'environ 50 individus .
J'ai donc crée ma fonction "distance" dont il s'agit en fait d'une norme euclidienne "pondérée" ( certains critères sont plus importants que d'autres) et je m'en vais essayer l'algorithme CAH ( classification ascendante hiérarchique ) qui d'après mes recherches semble assez utilisé mais avant de me prendre la tête sur la chose j'aimerais savoir si vous avez une estimation sur la durée d’exécution sur un ordinateur "normal" car j'ai besoin de pouvoir jouer sur mes coefficients de pondération pour trouver la classification que je souhaite (2/3h max donc par test ) et de plus j'aimerais savoir si il existerai un algorithme de "triangularisation" en dimension 2 pour que je puisse représenter spatialement la segmentation (sa m'aiderai beaucoup ) - j'ai pensé projeter sur x les 10 premiers critères (toujours pondéré) puis sur y les 10 autres . Qu'en pensez vous ?
Connaissez vous d'autres algorithmes plus efficace ? Pensez vous que ma fonction distance convienne ?
Je n'ai absolument aucune connaissance en algorithmique approfondie je suis étudiant en électronique merci d'avance pour votre aide .
Partager