Bonjour à tous,
J'étudie actuellement les facteurs prédictifs de l'apparition d'un outcome (dichotomique : apparition/non apparition). J'ai réalisé une première sélection des différentes variables à inclure dans la régression logistique à l'issu d'une analyse univariée de chacune des variables (Student/Mann-Withney-Wilcoxon ou Chi2/Fisher Exact selon la nature de la variable).
J'ai donc inclus ces variables "significatives" dans le modèle de régression logistique conduit via la PROC LOGISTIC. Les odds ratios obtenus pour certaines de ces variables apparaît surprenant :
ex : . moyenne(Poids) dans le groupe outcome=1 est > moyenne(Poids) dans le groupe outcome=0 en analyse descriptive (variable significative en univarié)
. Dans la PROC LOGISTIC, la probabilité modélisée est OUTCOME=1. l'odd ratio associé au Poids est < 1!! Cette "contradiction stat descriptive-odd ratio" est également observée sur certaines autres variables.
Avez-vous déjà eu une expérience identique? Qu'en pensez-vous?
Vous remerciant d'avance de votre retour.
Partager