IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Contradictions analyse univariée et régression logistique


Sujet :

SAS STAT

  1. #1
    Membre du Club
    Homme Profil pro
    Inscrit en
    Janvier 2012
    Messages
    29
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Janvier 2012
    Messages : 29
    Points : 43
    Points
    43
    Par défaut Contradictions analyse univariée et régression logistique
    Bonjour à tous,

    J'étudie actuellement les facteurs prédictifs de l'apparition d'un outcome (dichotomique : apparition/non apparition). J'ai réalisé une première sélection des différentes variables à inclure dans la régression logistique à l'issu d'une analyse univariée de chacune des variables (Student/Mann-Withney-Wilcoxon ou Chi2/Fisher Exact selon la nature de la variable).

    J'ai donc inclus ces variables "significatives" dans le modèle de régression logistique conduit via la PROC LOGISTIC. Les odds ratios obtenus pour certaines de ces variables apparaît surprenant :
    ex : . moyenne(Poids) dans le groupe outcome=1 est > moyenne(Poids) dans le groupe outcome=0 en analyse descriptive (variable significative en univarié)
    . Dans la PROC LOGISTIC, la probabilité modélisée est OUTCOME=1. l'odd ratio associé au Poids est < 1!! Cette "contradiction stat descriptive-odd ratio" est également observée sur certaines autres variables.

    Avez-vous déjà eu une expérience identique? Qu'en pensez-vous?

    Vous remerciant d'avance de votre retour.

  2. #2
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Bonjour.
    C'est une manifestation typique de multicolinéarité. Il faudrait simplifier ton modèle en éliminant les variables les moins utiles (sélection BACKWARD, ou élimination à la main à partir des tests de type 3).
    Bon courage.
    Olivier
    Bon courage.
    Olivier

  3. #3
    Membre du Club
    Homme Profil pro
    Inscrit en
    Janvier 2012
    Messages
    29
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Janvier 2012
    Messages : 29
    Points : 43
    Points
    43
    Par défaut
    Bonjour Olivier,

    Merci beaucoup pour tes conseils. Je vais creuser de ce côté.

    Bonne continuation

Discussions similaires

  1. Réponses: 1
    Dernier message: 26/07/2012, 18h07
  2. Régression logistique avec intéractions
    Par joyeux_lapin13 dans le forum SAS STAT
    Réponses: 1
    Dernier message: 27/04/2010, 11h43
  3. régression logistique et graphiques
    Par ebongue dans le forum SAS STAT
    Réponses: 4
    Dernier message: 16/06/2009, 13h54
  4. régression logistique SAS
    Par sandrine_87 dans le forum SAS STAT
    Réponses: 1
    Dernier message: 09/02/2009, 21h01
  5. Réponses: 1
    Dernier message: 17/04/2007, 16h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo