IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

CAH à partir de PROC CLUSTER


Sujet :

SAS STAT

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut CAH à partir de PROC CLUSTER
    Bonjour,

    Je suis entrain de réaliser plusieurs classifications ascendantes hiérarchiques à partir de PROC CLUSTER (une pour chacun des 5000 individus que j'étudie ; j'ai donc utilisé une seule procédure et le "BY individu").
    Comme le nombre de clusters varie d'un individu à un autre, je ne veux pas fixer un nb de clusters mais recourir au R² (un même R² pour tous mes individus). Est-il possible de le faire facilement?

    En fait, j'ai essayé de trouver une solution à partir du fichier en sortie de Outtree mais j'ai l'impression de m'embourber plus que de trouver une solution.

    Une solution?
    En vous remerciant,
    Claudine

  2. #2
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut CAH à partir de PROC CLUSTER
    Re-bonjour,

    J'ai trouvé un début de solution... mais j'aurais besoin de petits coups de pouce pour avancer...

    Petit rappel : je dispose d'un fichier de 5000 individus sur lesquels je souhaite appliquer une CAH à partir de PROC CLUSTER (BY individu). Je ne veux pas fixer un nombre de clusters car il n'est pas le même d'un individu à un autre. Par contre, je veux fixer un certain niveau de R² (0.98) que j'applique à chaque individu.
    Puis, je souhaite disposer d'un fichier en sortie où j'ai mes individus, le nombre de clusters et le nombre d'objets par cluster pour conduire quelques analyses.

    Le fichier en sortie de PROC CLUSTER n'est pas très maniable. Par contre, j'ai vu que le fichier en sortie de PROC TREE l'est beaucoup plus. L'inconvénient, PROC TREE me réclame un nombre de clusters en amont. Serait-il possible de trouver une solution à partir d'une MACRO qui me permettrait d'aller chercher le nombre de clusters en fonction du R2 (pour chacun de mes individus) et de l'appliquer à la PROC TREE?

    Si oui, et si cela vous parle, ou si vous l'avez déjà fait, je suis grandement preneuse (mes connaissances en macro étant très limitées).
    Merci!
    Claudine

  3. #3
    Rédacteur

    Homme Profil pro
    SAS ALLIANCE SILVER. Consultant et formateur SAS et Cognos.
    Inscrit en
    Avril 2009
    Messages
    2 497
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : SAS ALLIANCE SILVER. Consultant et formateur SAS et Cognos.
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2009
    Messages : 2 497
    Points : 6 064
    Points
    6 064
    Par défaut
    Claudine,
    tu peux nous envoyer un petit jeu d'essai et ton code ?
    N'oubliez pas de cliquer sur lorsque votre problème est réglé !

  4. #4
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut
    Bonjour,

    ... par contre, dans mon code, je n'ai pas encore introduit de MACRO (en gros, j'ai réussi à faire la partie simple du job... mais je cherche à savoir comment faire!)

    J'ai deux tables :
    1/ Une "cluster" qui contient les identifiants de mes individus et le nombre de clusters voulu pour chaque identifiant :
    identifiant _ncl_
    0001 6
    0023 2
    1235 3
    etc.

    2/ Une "outtree" qui correspond à la sortie de OUTTREE de PROC CLUSTER et que j'utilise pour le PROC TREE.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     PROC TREE DATA = outtree NCL = _ncl_ /*de la table "cluster"*/ NOPRINT OUT = sortie ;
    BY identifiant ;
    RUN ;
    ... je continue mes petites recherches sur Internet, on sait jamais si j'ai une étincelle!!!
    Par avance merci si vous l'avez avant moi!
    Claudine

  5. #5
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut
    Re-bonjour,

    J'ai finalement pris mon courage à deux mains... et j'ai fait les choses à la main, ce qui me prend finalement moins de temps que de me plonger dans le langage macro.
    En gros, vu qu'au maximum un individu a 16 clusters ; eh bien, j'ai fait autant de fichier d'individus que j'ai de clusters et j'ai réitéré les étapes DATA et PROC.

    Et pour finir, je fusionne le tout en une seule table prête à être analysée...

    Je n'ai donc plus besoin d'aide! Merci!
    Bonne après-midi,
    Claudine

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Proc fastclus suite à une proc cluster
    Par ThomasNi dans le forum SAS STAT
    Réponses: 2
    Dernier message: 09/07/2012, 13h35
  2. proc cluster log
    Par julien-isup dans le forum SAS STAT
    Réponses: 0
    Dernier message: 21/08/2009, 15h57
  3. Proc CLUSTER / TREE
    Par Petru16 dans le forum SAS STAT
    Réponses: 5
    Dernier message: 04/06/2009, 16h49
  4. Classification Hierarchique proc cluster
    Par stefsas dans le forum SAS STAT
    Réponses: 2
    Dernier message: 28/08/2008, 16h21
  5. Question proc cluster
    Par stefsas dans le forum SAS STAT
    Réponses: 1
    Dernier message: 27/08/2008, 17h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo