Bonjour,
Étant en vacance, je cherche à faire des exercices pour m'améliorer sur SAS (et autres). Tout simplement parce que je ne suis pas super bon...
J'ai trouvé un exercice, mais j'ai du mal à le terminer.
Voila le sujet:
Avec environ 1000 données (que des données quantitative et une qualitative), je dois faire un échantillonnage stratifié des données à partir de la variable qualitative.
Puis faire une ACP sur l'échantillon d’apprentissage.
Avec cette ACP je dois garder les dimensions pour faire une analyse discriminante (et créer un modèle).
Puis l'appliquer sur l'échantillon test (pour connaitre le pourcentage de bien placé).
Mon problème est que je n'arrive pas à récupérer les dimensions de l'ACP et faire l'analyse avec.
Voila mon code:
Quelqu'un à une idée de la manière de faire? Parce que j'ai une erreur. Ma demande de variable est mauvaise?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 ///Générer les échantillon PROC SURVEYSELECT DATA=exoplante METHOD=srs OUT=STRATA OUTALL SAMPRATE=0.555 SEED=123; strata lieu; RUN; data Apprent Valid; set STRATA; if Selected=0 then output Valid; if Selected=1 then output apprent; run; ///ACP sur l échantillon d apprentissage proc princomp data=apprent plots=score(ellipse) out=acptest; id lieu; run; ///Prendre les composantes principales: C est la que je bloque. PROC CORRESP data=acptest outc=acptest2; VAR PRIN1:PRIN8; run;
A noté que je souhaiterai faire à la suite la procèdure candisc (je ne sais pas si c'est utile à ma question )
Voila j'espère que ma question est assez compréhensible.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 PROC candisc data=acptest2; class lieu; run;
Je vous dis merci par avance.
Bonne journée
T
Partager