IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Proc GENMOD : ddl=0


Sujet :

SAS STAT

  1. #1
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2012
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Janvier 2012
    Messages : 1
    Points : 1
    Points
    1
    Par défaut Proc GENMOD : ddl=0
    Bonjour,

    Nous avons un projet de statistique à faire en SAS. Dans une des questions, nous devons ajuster le modèle à l'aide de la proc Genmod en enlevant les variables non significatives (p-valeur > 5%).

    Nous avons écrit:
    proc genmod data=Donnees;
    class Region;
    model Decouv = Age Region Mois Avoir/ dist = normal
    link = identity
    ;
    run;
    Region étant une variable modale qui prend comme valeur : MP, B, L . Nous obtenons le tableau des "Paramètres estimés par l'analyse du maximum de vraisemblance":

    Region : B ( DDL = 1, p-valeur = 0.1199)
    L ( DDL = 1, p-valeur = <.0001)
    MP ( DDL = 0, p-valeur = - )

    Donc nous allons devoir enlever la variable B puis refaire une régression avec L et MP. Mais le ddl de MP est toujours 0 donc on ne sait pas si on ne comprend pas trop ce qu'il faut faire après.

    Et aussi, on ne comprend pas trop ce que ça veut dire ddl = 0.

    Merci pour votre réponse,
    Cordialement,

  2. #2
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Bonjour.
    Moi aussi j'ai une question : pourquoi une proc GENMOD ? Si c'est pour faire le modèle que tu décris, une proc GLM suffit (si DECOUV suit une loi normale).

    Bon, à part ça, le sort des variables qualitatives dans un modèle. Pour bien comprendre, on va commencer tout simple, avec la variable SEXE qui vaut F ou M.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    PROC GENMOD DATA=sashelp.class ;
      CLASS sex ;
      MODEL weight = sex / DIST=NORMAL LINK=IDENTITY ;
    RUN ;
    On obtient le tableau de coefficients suivant :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    Parameter         DF    Estimate
    Intercept          1    108.9500
    Sex          F     1    -18.8389
    Sex          M     0      0.0000
    La dernière modalité par ordre alphabétique (M) a un coefficient forcé à zéro : c'est la modalité de référence. Comme ce choix est forcé, il n'y a pas de degré de liberté associé : DDL=0.
    Ce choix est arbitraire. Si on codait la variable SEX autrement (2 pour filles et 1 pour les garçons), ce qu'on va montrer avec un format, on obtient un autre jeu de coefficients totalement équivalent au précédent.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    PROC FORMAT ;
      VALUE $sexe
        "F"="2" "M"="1"
      ;
    RUN ;
    PROC GENMOD DATA=sashelp.class ;
      CLASS sex ;
      FORMAT sex $sexe. ;
      MODEL weight = sex / DIST=NORMAL LINK=IDENTITY ;
    RUN ;
    et le résultat
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    Parameter         DF    Estimate
    Intercept          1     90.1111
    Sex          1     1     18.8389
    Sex          2     0      0.0000
    Donc on peut choisir cette référence comme on veut, et ça n'a aucune incidence sur le modèle.

    Vient ensuite la question de la significativité des coefficients. Le test de significativité (test de Wald dans la proc GENDMOD) a pour hypothèse nulle que le coefficient vaut zéro.
    Dans le cas d'une variable quantitative, ça veut dire qu'elle a une pente nulle, donc aucune influence linéaire sur Y.
    Dans le cas d'une modalité d'une variable qualitative, ça veut dire que l'écart avec la référence, en termes de moyennes de Y, est inexistant. Autrement dit, si on a un coefficient pour X=A non significatif, avec X=C comme référence, alors les moyennes de Y pour X=A et pour X=C sont tellement "proches" qu'elles sont statistiquement indiscernables.
    Dans ce cas, si un tel regroupement a un sens "métier", on peut fusionner les deux modalités A et C en une seule. Et refaire ensuite le modèle.
    Le risque c'est de sauter aux conclusions à la seule vue du tableau des coefficients : voir que A et C ne sont pas significativement différents, alors qu'en réalité, l'écart entre A et B est encore moins significatif (--> A et B devraient être fusionnés en priorité). Mais si C est la référence, rien dans le tableau de coefficients n'indique la significativité de l'écart entre A et B. Il faudrait choisir une de ces 2 modalités comme référence.

    Le plus simple dans ce cas est d'utiliser l'instruction LSMEANS et son option DIFF. On aura ainsi toutes les comparaisons 2 à 2 de modalités. On fusionne les deux dont la p-value sera la plus élevée, à condition que cette fusion ait un sens (par exemple, si ce sont des CSP, on ne fusionnera pas "cadres" et "ouvriers" car la nouvelle catégorie serait difficile à justifier). Et on refait le modèle, et ainsi de suite, jusqu'à ce que toutes les p-values soient, soit en-dessous du seuil choisi à l'avance (tu évoques 5%), soit associées à des couples non fusionnables.

    J'espère avoir répondu à tes interrogations.
    Bon courage.
    Olivier
    Bon courage.
    Olivier

  3. #3
    Membre du Club
    Profil pro
    Inscrit en
    Décembre 2009
    Messages
    193
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2009
    Messages : 193
    Points : 53
    Points
    53
    Par défaut
    Bonjour phuphu,

    D'abord comme dit olivier, je ne comprend pas pourquoi une proc GENMOD? Une proc GLM suffit tout simplement.
    De plus, je ne comprend pas vraiment votre question... Pouvez vous être un peu plus clair svp?

    En tout cas bonne chance
    Merci.

  4. #4
    Membre chevronné
    Homme Profil pro
    Biostatisticien
    Inscrit en
    Juin 2009
    Messages
    1 206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Irlande

    Informations professionnelles :
    Activité : Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Juin 2009
    Messages : 1 206
    Points : 1 868
    Points
    1 868
    Par défaut
    Bonjour, je rejoins les commentaires de bsangoku.

    Merci de nous preciser quel est l'objectif escompte. En fonction de cela il y aura peut etre moyen de t'aider sur le choix de la syntaxe, et t'aider a la comprehension de to sortie sas.

    nous devons ajuster le modèle à l'aide de la proc Genmod en enlevant les variables non significatives
    Region étant une variable modale qui prend comme valeur : MP, B, L
    Donc nous allons devoir enlever la variable B
    Attention a ne pas confondre variable et categorie.

Discussions similaires

  1. Proc genmod avec appariement
    Par booouuu dans le forum SAS STAT
    Réponses: 1
    Dernier message: 13/07/2017, 16h16
  2. Réponses: 1
    Dernier message: 06/03/2013, 18h25
  3. Réponses: 3
    Dernier message: 14/12/2010, 09h27
  4. Problème avec proc genmod
    Par Pinechip dans le forum SAS STAT
    Réponses: 1
    Dernier message: 09/10/2009, 12h47
  5. Oracle 8 : Proc. stock. + DDL
    Par davy.g dans le forum Oracle
    Réponses: 6
    Dernier message: 11/04/2007, 11h13

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo