|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | |
|
Invité régulier
![]() Inscription : juillet 2010 Messages : 28 ![]() |
Bonjour,
j'effectue une analyse en correspondance multiple sous SAS, (proc corresp sur un tableau disjonctif complet) avec 3 variables qualitatives. Tout marche bien (afin j'ai des resultats qui me semblent cohérents) mais dans la log j'ai un message d'avertissement : Citation:
Merci d'avance. |
|
|
|
00
|
|
|
#2 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
Salut.
Aucun souci quant à la validité de tes résultats. Pour chaque point (de l'espace des variables ou de l'espace des individus), SAS essaye de calculer automatiquement sur quel axe il est le mieux représenté, à partir des statistiques de contribution. Le message signale juste que pour au moins un point, il y avait 2 axes en concurrence très serrée pour être les meilleurs reflets de sa position : d'où la non-unicité de la valeur stockée dans la colonne BEST. Bref, comme peu de monde utilise la colonne BEST et préfère se repérer aux coordonnées factorielles et aux cosinus carrés, ça n'a absolument aucune conséquence néfaste. Olivier |
|
|
10
|
|
|
#3 |
|
Invité régulier
![]() Inscription : juillet 2010 Messages : 28 ![]() |
Merci Monsieur c'est gentil ....
Je me permet juster de vous poser une dernière question : A la suite de mon AFCM, j'ai retenu trois axes, puis j'ai effectué un classification hierarchique avec le saut de Ward comme methode. j'ai obtenu 4 classes (obtenu par la régle du coude, dendrogramme....). Seulement j'ai un ccc (cubic clustering criterion) de -0,222. Mais j'ai cru comprendre que si le ccc est < 2 alors la classification est douteuse. pourtant j'ai un R-carré de 66% (variance expliquée) pour 4 classes, donc je me dis que la classification est plutot bonne?? Est ce que pouvez m'eclairer là dessus. Merci d'avance PS : Au passage un grand votre site internet est d'une grande utilité et j'y ai appris pas mal de choses. |
|
|
00
|
|
|
#4 |
|
Expert Confirmé
![]() ![]() Olivier DecourtFormateur en informatique Inscription : avril 2008 Messages : 1 467 ![]() |
... je croyais que tout le monde se tutoyait sur ce forum !
Le CCC est une petite bête pénible ; d'après SAS, effectivement, en-dessous d'une certaine valeur (je croyais me souvenir de 3, mais mettons 2, le raisonnement est le même) la classification n'est pas bonne. Il est couramment arrivé de ne jamais avoir de CCC positif, que je fasse 2 à 50 classes sur mes données ! Donc je pense que comme pour tous les indicateurs statistiques (corrélation, V de Cramer, R², etc.) il ne faut pas vraiment se fixer de seuils intangibles, valables pour tous les jeux de données, mais adapter ses ordres de grandeur. L'idéal serait de regarder le CCC selon le nombre de classes : si le pic est à 4 classes, hé bien, super, faisons 4 classes ! Les 66% de variance expliquée me semblent effectivement rassurants. Pour être complètement serein, tu peux aussi représenter l'espace des individus sur les 2 premiers axes de l'ACM, en coloriant les points selon la classe : on devrait voir distinctement les 4 "patates" d'individus. Bon courage. Olivier (pas Monsieur) |
|
|
00
|
|
|
#5 |
|
Invité régulier
![]() Inscription : juillet 2010 Messages : 28 ![]() |
J'ai représenté mes points sur le plan factoriel de l'AFCM, en mettant des couleurs sur les différentes classes et là :
Sur un échantillon de 48 individus, le graph ne porte que sur 17 individus.... En fait j'ai regardé les coordonnées de mes individus, et je m'aperçois que plusieurs individus ont les mêmes coordonnées sur dim1 et dim2... Quad je reviens à la source de mes données je vois que plusieurs point ont à peu-prés le même profil (redondance d'information).... Il faut à mon avis repartir de la source et selectionner un echantillon pertinent... En tout cas merci pour tout. |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com