IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

proc corresp sur SAS


Sujet :

SAS STAT

  1. #1
    Membre habitué
    Profil pro
    Inscrit en
    Juillet 2010
    Messages
    114
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2010
    Messages : 114
    Points : 158
    Points
    158
    Par défaut proc corresp sur SAS
    Bonjour,
    j'effectue une analyse en correspondance multiple sous SAS, (proc corresp sur un tableau disjonctif complet) avec 3 variables qualitatives. Tout marche bien (afin j'ai des resultats qui me semblent cohérents) mais dans la log j'ai un message d'avertissement :
    Row partial contributions to inertia are tied or nearly tied. There may be more than one possible set of BEST statistics.
    Est ce que quelqu'un sait exactement c'est quoi? Je vois que ça parle d'une histoire d'ex aquo sur les contributions au Ki-2, mais je me demande si cela peut remettre en cause la validité de mes resultats??

    Merci d'avance.

  2. #2
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Salut.
    Aucun souci quant à la validité de tes résultats. Pour chaque point (de l'espace des variables ou de l'espace des individus), SAS essaye de calculer automatiquement sur quel axe il est le mieux représenté, à partir des statistiques de contribution. Le message signale juste que pour au moins un point, il y avait 2 axes en concurrence très serrée pour être les meilleurs reflets de sa position : d'où la non-unicité de la valeur stockée dans la colonne BEST.
    Bref, comme peu de monde utilise la colonne BEST et préfère se repérer aux coordonnées factorielles et aux cosinus carrés, ça n'a absolument aucune conséquence néfaste.
    Olivier
    Bon courage.
    Olivier

  3. #3
    Membre habitué
    Profil pro
    Inscrit en
    Juillet 2010
    Messages
    114
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2010
    Messages : 114
    Points : 158
    Points
    158
    Par défaut proc corresp SAS
    Merci Monsieur c'est gentil ....

    Je me permet juster de vous poser une dernière question :

    A la suite de mon AFCM, j'ai retenu trois axes, puis j'ai effectué un classification hierarchique avec le saut de Ward comme methode. j'ai obtenu 4 classes (obtenu par la régle du coude, dendrogramme....). Seulement j'ai un ccc (cubic clustering criterion) de -0,222. Mais j'ai cru comprendre que si le ccc est < 2 alors la classification est douteuse. pourtant j'ai un R-carré de 66% (variance expliquée) pour 4 classes, donc je me dis que la classification est plutot bonne??

    Est ce que pouvez m'eclairer là dessus. Merci d'avance

    PS : Au passage un grand votre site internet est d'une grande utilité et j'y ai appris pas mal de choses.

  4. #4
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    ... je croyais que tout le monde se tutoyait sur ce forum !
    Le CCC est une petite bête pénible ; d'après SAS, effectivement, en-dessous d'une certaine valeur (je croyais me souvenir de 3, mais mettons 2, le raisonnement est le même) la classification n'est pas bonne. Il est couramment arrivé de ne jamais avoir de CCC positif, que je fasse 2 à 50 classes sur mes données ! Donc je pense que comme pour tous les indicateurs statistiques (corrélation, V de Cramer, R², etc.) il ne faut pas vraiment se fixer de seuils intangibles, valables pour tous les jeux de données, mais adapter ses ordres de grandeur.
    L'idéal serait de regarder le CCC selon le nombre de classes : si le pic est à 4 classes, hé bien, super, faisons 4 classes !
    Les 66% de variance expliquée me semblent effectivement rassurants. Pour être complètement serein, tu peux aussi représenter l'espace des individus sur les 2 premiers axes de l'ACM, en coloriant les points selon la classe : on devrait voir distinctement les 4 "patates" d'individus.
    Bon courage.
    Olivier (pas Monsieur)
    Bon courage.
    Olivier

  5. #5
    Membre habitué
    Profil pro
    Inscrit en
    Juillet 2010
    Messages
    114
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2010
    Messages : 114
    Points : 158
    Points
    158
    Par défaut proc corresp dans SAS
    J'ai représenté mes points sur le plan factoriel de l'AFCM, en mettant des couleurs sur les différentes classes et là :

    Sur un échantillon de 48 individus, le graph ne porte que sur 17 individus.... En fait j'ai regardé les coordonnées de mes individus, et je m'aperçois que plusieurs individus ont les mêmes coordonnées sur dim1 et dim2... Quad je reviens à la source de mes données je vois que plusieurs point ont à peu-prés le même profil (redondance d'information).... Il faut à mon avis repartir de la source et selectionner un echantillon pertinent...

    En tout cas merci pour tout.

Discussions similaires

  1. Macro %AIDEACM suite à une PROC CORRESP sur SAS
    Par Felizzy dans le forum Macro
    Réponses: 3
    Dernier message: 19/01/2011, 19h20
  2. proc logistic sur SAS
    Par chfen dans le forum SAS STAT
    Réponses: 4
    Dernier message: 09/09/2010, 14h26
  3. Réponses: 0
    Dernier message: 11/04/2008, 10h04
  4. Forum, cours et tutoriels sur SAS ?
    Par marie mouse dans le forum Mode d'emploi & aide aux nouveaux
    Réponses: 12
    Dernier message: 10/01/2008, 09h26
  5. Proc Corresp
    Par estelle3012 dans le forum SAS STAT
    Réponses: 1
    Dernier message: 22/08/2007, 02h21

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo