IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Test statistique sous SAS de comparaison de proportions


Sujet :

SAS STAT

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Points : 14
    Points
    14
    Par défaut Test statistique sous SAS de comparaison de proportions
    Bonjour,
    je souhaite exécuter des tests de comparaison de proportion sous SAS dans un tableau croisé Groupe vs Région
    pour identifier quels % sont significatifs (à 95% de confiance).

    Exemple Mon groupe 1 avec 13% est significativement (95%de confiance) plus faible dans le Nord que dans le reste de la France.

    merci de votre aide
    Fichiers attachés Fichiers attachés

  2. #2
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Bonjour
    Il faut utiliser la procédure Freq et mettre l'orption relrisk. Il vous donnera les cotes ainsi que les pvaleurs. Vous pourrez faire la comparaison des proportions entre région.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    proc freq data=Toto;
    tables Groupe*Region/relrisk;
    run;
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  3. #3
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Ok je n'avais pas remarqué que le tableau n'est pas 2*2. Vous ne pouvez pas utiliser relrisk alors. Il va falloir faire une petite modification.
    Si vous voulez un commentaire du genre (comme votre exemple), il faut construire plusieurs tableaux 2*2 pour pouvoir appliquer la méthode précédente. Un exemple de tableau 2*2 aura deux modalités lignes (Groupe1 VS Les autres groupes) et modalité colonne (Region1 Vs les autres regions). Vous pouvez donc conclure par exemple qu'il y a une forte proportion dans le groupe 1 région 1 que les autres groupes. Vous pouvez avoir toutes les configurations que vous voulez. Mais il faut ramer toujours le problème à un cas bivarié. Une petite macro peut régler l'affaire pour ne pas écrire un code long.
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  4. #4
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Points : 14
    Points
    14
    Par défaut
    Bonjour Haache,
    effectivement j'ai reproduit le test sous excel pour comprendre comment il était fait et tu as raison c'est bien un test 2 à 2 qui est réalisé. Je vais donc tester la proc freq / RELRISK pour voir si cela répond bien à mon problème.

    Je te tiendrai informé bien sûr.
    Merci

  5. #5
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Ok
    Une autre option est de tester si dans chaque groupe les proportions sont distribuées uniformément dans les régions, soit une proportion de 100/7 % par région.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    proc freq data=Toto;
    by groupe;
    tables Regions /nocum testp=(100/7 100/7 100/7 100/7 100/7 100/7 100/7);
    run;
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  6. #6
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Points : 14
    Points
    14
    Par défaut
    Hello H,
    tout d'abord merci de prendre du temps pour me répondre.


    comme tu me l'a conseillé je me suis ramené à un tableau 2*2 puis j'ai réalisé les RELRISK :


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    data test;
       input region :$10. groupe $ count;
       cards;
    NORD GROUPE1 5
    NORD RESTE 34
    AUTRES_REG RESTE 165
    AUTRES_REG GROUPE1 71
    ;
    run; 
     
    proc freq data=test order=data;
     weight count;
     tables groupe*region
     /  RELRISK ;
    run;

    j'obtiens alors un Relative Risk (Column 1) de 0.3851 qui varie entre 0.1564 et 0.9479 à 95% de confiance. A comparer, je suppose, au Relative Risk (Column 2) de 1.127 qui varie entre 1.033 et 1.2289.
    Dans la mesure où il n'y a pas chevauchement des IC, nous concluons que cette strate est sous évaluée;

    Es tu d'accord avec cette analyse ?

  7. #7
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Bonjour
    C'est à peu près ça mais au lieu de comparer risk1 à risk2 il faut voir le rapport de cote générale. Il mesure directement les chances de la première modalité ligne dans le première modalité colonne relativement à la deuxième modalité colonne. Donc si on a un risk général de 3 par exemple avec un IC qui ne contient pas 1, on dira que la première modalité ligne est trois fois plus susceptible d'être réalisée dans le première colonne que dans la deuxième colonne. Excuse moi pour les terminologie modalité ligne et colonne que j'utilise ici c'est pour donner un exemple. Sinon ces modalités correspondent à Nord, Autres régions ect.
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  8. #8
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Points : 14
    Points
    14
    Par défaut
    ici dans mon exemple le rapport de côte (ou ODDS RATIO) est de 0.3418 [0.1284 - 0.9098].
    Le Relative Risk (Column 1) est de 0.3851 [0.1564-0.9479]
    Le Relative Risk (Column 2) est de 1.127 [1.033-1.228]

    Ce qui signifie que le risque d'être dans le GROUPE1 dans le Nord est trois fois moins grand que dans le reste de la France.
    Cela mesure un ordre de grandeur. Comment selon ces stats dire avec certitude que le GROUPE 1 est plus faiblement représenté que dans le reste de la France?

    tu indiques plus bas "avec un IC qui ne contient pas 1" ?
    Est ce que cela signifie que dès lors que l'IC du rapport de côte ne contient pas 1 nous sommes sûrs à 95% que le GROUPE 1 est plus faiblement représenté que dans le reste de la France?

  9. #9
    Membre éprouvé
    Avatar de Haache
    Homme Profil pro
    Doctorant & Ingénieur Statiaticien Economiste
    Inscrit en
    Mars 2014
    Messages
    349
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : Canada

    Informations professionnelles :
    Activité : Doctorant & Ingénieur Statiaticien Economiste

    Informations forums :
    Inscription : Mars 2014
    Messages : 349
    Points : 1 009
    Points
    1 009
    Billets dans le blog
    8
    Par défaut
    Je comprends
    Si tu veux dire que le groupe 1 est plus représenté ou moins que le reste de la France alors, ça devient un problème univarié. Les zones ne comptent pas donc ? Si tu veux juste comparer le groupe 1 avec le reste de la France, il suffit jute de faire

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    proc freq data=table;
    table Groupe /testp (50 50);
    run;
    Ici je suppose que Groupe est une variables binaire (Groupe1 et reste de la France). Donc je teste une hypothèse nulle ou les deux modalité ont une même représentativité. SAS pourra me tester si je dois la rejeter ou pas. C'est- à-dire si je dois la rejeter ou pas

    Quant à l'intervalle de confiance des cotes, s'il contient 1 c'est que la cote n'est pas significativement différente de 1. Donc il n'y a pas de différence entre les régions. Ici on a 0.34 et l'IC ne contient pas 1 donc le groupe 1 est 1/0.34=3 fois moins représenté que le reste de la France dans le Nord par rapport aux autres régions.
    • Faites un tour sur mon siteweb professionnel www.aristideelysee.16mb.com Des codes dans la section "media et code" pouvant vous aider que vous pouvez aussi partager sur les réseaux sociaux.
    • Visiter mon blog en cliquant ici! Des techniques, astuces et macros pour l'analyse quantitative.

  10. #10
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Points : 14
    Points
    14
    Par défaut
    Merci H,
    je vais rester sur le test RELRISK ; il ne me reste plus qu'à développer une macro alambiquée pour tester toutes les combinaisons deux à deux.


    Une question subsidiaire : pourquoi ne pas utiliser l'option RISKDIF qui testera la différénce de proportion ?

    bye
    Eric

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Test statistiques sous qlikview
    Par arnest dans le forum QlikView
    Réponses: 2
    Dernier message: 28/04/2015, 12h26
  2. Test statistique sous R
    Par cindy 31000 dans le forum R
    Réponses: 1
    Dernier message: 01/08/2013, 11h47
  3. Test statistique sous Java
    Par Sofistaat dans le forum Débuter avec Java
    Réponses: 4
    Dernier message: 31/01/2013, 08h09
  4. analyse statistique sous SAS
    Par ambitious2010 dans le forum SAS STAT
    Réponses: 1
    Dernier message: 31/03/2010, 08h18
  5. Tests statistiques sur des proportions
    Par kate29 dans le forum SAS STAT
    Réponses: 5
    Dernier message: 17/04/2009, 21h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo