Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS STAT
SAS STAT Forum d'entraide sur les fonctionnalités liées à la statistique sur SAS : statistique descriptive, test, régression, classification
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 03/01/2012, 19h34   #1
Invité de passage
 
Homme
Consultant fonctionnel
Inscription : décembre 2011
Messages : 10
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Consultant fonctionnel

Informations forums :
Inscription : décembre 2011
Messages : 10
Points : 0
Points : 0
Par défaut Test du Khi 2

Bonjour,

j'aurai une question sur la réalisation d'un test du Khi-2 sous SAS (SEG plus précisément).
J'en ai déja réalisé grace à la proc freq, en utilisant comme variable discriminante les modalités d'une variable.
Je voudrais réitérer l'exercice mais en utilisant un découpage selon deux variables.
Concrètement, avant mon code ressemblait à:

Code :
1
2
3
proc freq DATA=MaTable;
TABLE var1*var2 / chisq expected missing;
run;
je voudrais qu'il ressemble à

Code :
1
2
3
proc freq DATA=MaTable;
TABLE (var1*var2)*var3 / chisq expected missing;
run;
J'espère avoir été clair, merci pour votre aide et meilleurs voeux pour 2012 !
Mill.
Mill5 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/01/2012, 20h09   #2
Responsable SAS
 
Inscription : septembre 2006
Messages : 1 971
Détails du profil
Informations forums :
Inscription : septembre 2006
Messages : 1 971
Points : 4 813
Points : 4 813
Bonjour,
Quelle hypothèse veux-tu alors tester dans le deuxième cas?
Merci
__________________
Les balises code
FAQ SAS
Rubrique SAS

Si vous souhaitez contribuer à la rubrique SAS, contactez-moi ou tout autre membre de l'équipe BI par MP.
fafabzh6 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/01/2012, 21h54   #3
Expert Confirmé
 
Avatar de olivier.decourt
 
Homme Olivier Decourt
Formateur en informatique
Inscription : avril 2008
Messages : 1 467
Détails du profil
Informations personnelles :
Nom : Homme Olivier Decourt
Âge : 34
Localisation : France

Informations professionnelles :
Activité : Formateur en informatique
Secteur : Conseil

Informations forums :
Inscription : avril 2008
Messages : 1 467
Points : 2 828
Points : 2 828
Bonsoir Mill.
La syntaxe var1*var2*var3 donne des tableaux croisés (et donc des khi-2) selon var2*var3, stratifié par var1.
Si je comprends ta demande, mettons SEXE*IDF*ACHAT_PRODUIT, tu voudrais connaître le khi-2 qui lie l'achat du produit avec les combinaisons des caractéristiques hommes/femmes et habite/n'habite pas en Ile de France. Donc le lien entre (sur cet exemple) une variable à 4 modalités et ACHAT_PRODUIT.
Effectivement, la syntaxe que tu exposes ne donnera pas ce résultat. Je ne pense pas qu'on puisse faire mieux que de créer en amont la variable combinée à 4 (ou plus) modalités avec du SQL ou une étape DATA, et ensuite travailler sur cette variable combinée.
J'espère avoir bien compris la question.
Bon courage.
Olivier
olivier.decourt est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/01/2012, 22h16   #4
Membre Expert
 
Homme
Biostatisticien
Inscription : juin 2009
Messages : 1 150
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Irlande

Informations professionnelles :
Activité : Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : juin 2009
Messages : 1 150
Points : 1 772
Points : 1 772
Mouais, je serais quand meme de l'avis de fafabzh6: tu veux savoir quoi? Je pressens quand meme qu'Olivier a tape dans le mille avec sa syntaxe..

Allez, pour le fun, un petit lien vers le fameux paradoxe de Simpson (avec examples!). On passe a trois a deux variables de segregation et les resultats se contredisent. Juste histoire d'illustrer de bien savoir ou on va (ce que je ne mets pas en doute), meme si ici on s'eloigne probablement un peu de ton cas pratique.
http://en.wikipedia.org/wiki/Simpson%27s_paradox
Manoutz est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/01/2012, 13h43   #5
Invité de passage
 
Homme
Consultant fonctionnel
Inscription : décembre 2011
Messages : 10
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Consultant fonctionnel

Informations forums :
Inscription : décembre 2011
Messages : 10
Points : 0
Points : 0
Bonjour à tous,

merci pour vos réponses.
Effectivement, la solution semble être de créer une variable tierce (en concaténant les deux variables de base par exemple) et de travailler avec cette nouvelle variable, comme le suggérait Olivier.

Merci.
Mill5 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/01/2012, 15h12   #6
Membre Expert
 
Homme
Biostatisticien
Inscription : juin 2009
Messages : 1 150
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : Irlande

Informations professionnelles :
Activité : Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : juin 2009
Messages : 1 150
Points : 1 772
Points : 1 772
Je ne suis pas que c'est ce que suggere Olivier. Ses trois variables sont independentes (tu ne peux pas obtenir la variable ACHAT_PRODUIT en concatenant SEXE et IDF) - a moins que je ne saisisse pas ce que tu veuilles dire.

Un peu plus d'explications seraient les bienvenues

Manoutz
Manoutz est déconnecté   Envoyer un message privé Réponse avec citation 10
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 06h22.


 
 
 
 
Partenaires

Hébergement Web