Bonjour,
Dans le cadre de mon stage de fin d'étude, je dois réaliser une typologie des pharmacies françaises (+21500) triées par zone iris. J'ai une centaine de données qui sont toutes quantitatives.
Pour la réaliser, mon tuteur m'a conseillé de n'utiliser que les taux (nbre de pharmacie + population dans l'iris -> nbre de pharmacie/iris).
Je me dis donc que je vais procéder de la sorte :
tableau disjonctif complet
acp
cah (proc fastclus puis proc cluster car bcp de données)
décision du nombre de classes via le dendogramme
jointures des tables
description des classes
analyse discriminante afin de vérifier la pertinence de la typo
Cependant, je ne vois que des tdc réalisés pour en faire une acm (avec discrétisation des variables au tout début).
La question que je me pose est de savoir si je dois préalablement discrétiser ma centaine de variables pour réaliser le tdc pour enfin réaliser une acm et ce qui suit ci-dessus.
Très cordialement.
Partager