Bonjour à tous,
Grace à une régression logistique, je cherche à identifier parmi différents paramètres environnementaux, ceux qui influencent ma variable à expliquer, qui est de type binaire.
J'ai utilisé un glm quasibinomial. Pourriez-vous m'indiquer dans ce cas, le ou les moyens à privilégier afin de sélectionner le meilleur modèle possible ? On utilise généralement l'AIC me semble-t-il. Cependant, celui-ci n'est pas calculé dans le cas d'un glm quasibinomial. Doit-on dans ce cas, comparer simplement les différences de déviances entre chaque couple de modèle ?
De plus, en utilisant les mêmes termes mais dans un ordre différent je ne trouve pas les mêmes paramètres significatifs. J'ai d'autant plus de mal à choisir les paramètres à conserver dans mon modèle... Dans l'idéal, je cherche une fonction R qui permettrait cette sélection, via la méthode "pas à pas" par exemple (afin d'éviter les inconvénients des méthodes ascendantes et descendantes), mais qui, du coup, ne se baserait pas sur les AIC. Est-ce possible ?
J'ai une seconde question... Certains auteurs suggèrent que la surdispersion est quasiment la règle dans les régressions logistiques et qu'il vaut mieux systématiquement en tenir compte, plutôt que de la négliger alors qu'elle était bien présente. J'ai lu de plus, que les résultats ne seraient de toute façon pas affectés s'il n'y avait en réalité, pas de surdispersion. Est-ce gênant dans ce cas de passer spontanément à un glm quasibinomial sans avoir essayer le glm binomial et même si les données n'indiquaient pas particulièrement une surdispersion à la base ?
Merci beaucoup pour votre aide,
Ginger
Partager