Bonjour,
J'ai un petit souci de compréhension sur l'application d'un GLM binomial à mon jeu de données.
Le dataframe sur lequel j'applique mon GLM est de la forme :
Zone Trimestre Année Taille nbsucces nbechec
Zone1 Tri1 2005 petit 2 0
Zone2 Tri2 2006 moyen 1 1
Zone3 Tri3 2007 grand 3 2
Zone4 Tri4 2008 grand 0 2
Zone4 Tri4 2008 petit 4 1
Zone2 Tri2 2007 moyen 5 2
Je cherche à étudier et prédire la proportion d'échec par rapport à mes 4 variables explicatives. Mes valeurs de succès et d'échec ne sont pas de type 0 et 1 car j'ai effectué au préalable un aggregate sur mes données brutes afin d'avoir une somme d'observations par strate (caractérisées par les 4 variables).
J'applique mon glm après avoir transformé mes variables explicatives en factor
model<-glm(cbind(nbechec,nbsucces)~ Zone + Trimestre + Taille + Année ,family=binomial(link="logit"))
J'obtiens alors un
Message d'avis :
glm.fit: des probabilités ont été ajustées numériquement à 0 ou 1, que j'ai du mal à expliquer.
En voulant sélectionner le model parcimonieux à l'aide de la fonction step
model.stp<-step(model,direction="backward")
même messages d'avis
En effectuant un test Chi² mes variables retenues par Akaiké ont une p-value satisfaisante mais pour mon
toutes les p-values sont proches de 1 et identiques
pourtant mon pseudo R² m'indique une valeur correcte pour mon modèle.(0.6)
J'ai énormément de mal à comprendre les warnings et à déterminer si mon modèle peut être conservé dans l'état.
J'espère que certains d'entre vous pourront m'éclairer et les en remercie d'avance.
Partager