Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS STAT
SAS STAT Forum d'entraide sur les fonctionnalités liées à la statistique sur SAS : statistique descriptive, test, régression, classification
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 27/12/2007, 11h01   #1
Nouveau Membre du Club
 
Inscription : avril 2007
Messages : 95
Détails du profil
Informations forums :
Inscription : avril 2007
Messages : 95
Points : 25
Points : 25
Par défaut Fonctionnement de la procédure VARCLUS

bonjour

je débute en SAS et je ne comprend pas bien le fonctionnement de la procédure VARCLUS

j'ai ce bout de code :
Code :
1
2
proc varclus DATA=clust.test_vs_test outtree=clust.tree;
run;
où clust.test_vs_test est une table contenant 1989 variables

si j'ai bien compris, VARCLUS est censé réduire ce nombre de variables

mais à l'exécution, j'ai le message d'erreur suivant :
"All observations in data set CLUST.TEST_VS_TEST have missing values, or the sum of weights or frequencies is nonpositive."
alors ok j'ai des valeurs manquantes, mais pas dans TOUTES les observations...

je pense que quelque chose m'échappe, quelqu'un à une idée ?

merci et bonne journée
mitmit est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 27/12/2007, 11h40   #2
Nouveau Membre du Club
 
Inscription : avril 2007
Messages : 95
Détails du profil
Informations forums :
Inscription : avril 2007
Messages : 95
Points : 25
Points : 25
bon le problème est résolu

en effet pour appliquer VARCLUS il faut n'avoir aucune valeur manquante dans aucune des observations associées aux variables de la table prise en entrée

par contre je me suis rendu compte que je n'avais pas compris l'utilité de cette procédure : une fois que le clustering sur les variables est achevé, que l'arbre est dessiné et affiché, on fait quoi ?
y a-t-il un moyen de produire une table contenant les clusters et leurs valeurs associées ? sinon quel est l'intérêt de cette méthode ?

en vous remerciant à nouveau

ps : désolé pour le double post
mitmit est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 04/01/2008, 09h22   #3
Responsable SAS
 
Inscription : septembre 2006
Messages : 1 973
Détails du profil
Informations forums :
Inscription : septembre 2006
Messages : 1 973
Points : 4 807
Points : 4 807
Bonjour,
Je ne connaîs pas cette proc mais je pense qu'il faut qu tu fasse un choix par rapport à la proportion de variance expliquée.
Le lien suivant que tu as certainement du déjà consulté va peut être pouvoir t'aider.
http://www2.stat.unibo.it/ManualiSas/stat/chap68.pdf
Bon courage
fafabzh6 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 07/01/2008, 09h21   #4
Nouveau Membre du Club
 
Inscription : avril 2007
Messages : 95
Détails du profil
Informations forums :
Inscription : avril 2007
Messages : 95
Points : 25
Points : 25
merci pour la réponse

je progresse dans ma compréhension de la procédure, mais je me heurte à un nouveau problème : un nombre de variables trop important dans la table d'entrée qui génère une erreur "out of memory"

je vais me pencher sur la procedure princomp, qui semble alléger le travail de varclus

si vous avez des suggestions, des idées, n'hésitez pas, tout ceci est très nouveau pour moi

++
mitmit est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 16h53.


 
 
 
 
Partenaires

Hébergement Web