Bonjour,
Je dois réaliser une classification à partir d'un jeu de données quantitatives plutôt creux (certaines variables sont alimentées pour tous les individus mais d'autres ne le sont que très peu).
Cette classification doit mettre en évidence les individus atypiques, c'est pourquoi j'aimerais éviter de supprimer trop de variables.
A priori, les cartes de kohonen semblent avoir les propriétés qui conviennent à ce type de sujet mais j'aimerais avoir quelques confirmations :
- La présence de nombreux 0 ne risque-t-elle pas de trop fausser les résultats ?
- Existe-t-il un moyen d'utiliser un package du genre SOM, Kohonen ou SOMbrero en utilisant en entrée un jeu recodé de façon à réduire la taille de la matrice de départ (qui est creuse) ? Sinon, existe-t-il un autre package qui le fasse ? Sinon... autres suggestions ?
Merci pour toute piste (même floue) que vous pourrez m'indiquer.
Partager