Bonjour à tous,
Mes questions concernent l'interprétation de résultats de deux méthodes que l'on m'a suggéré pour comparer des GLM: le step AIC et l'ANOVA. Je pense que pour y répondre vous devez connaitre un peu le contexte de mon étude; voilà pour quoi j'ai décidé de le développer ci-dessous:
J'essaie de répondre à diverses questions relatives au braconnage dans le cadre d'une étude des effets des activités anthropiques sur la faune sauvage dans une région en Tanzanie.
Voici les questions auxquelles je souhaiterais répondre:
- Est-ce que les braconniers ont plus tendance à chasser dans un certain type de végétation?
- Est-ce qu'ils ont plus tendance à chasser durant une certaine saison?
- Est-ce que le braconnage évolue au fil des ans?
- Est-ce que la présence des chercheurs influence la répartition du braconnage?
- Est-ce que la présence d'un camp de réfugiés proche de la zone d'étude influence la répartition du braconnage?
Je dispose pour cela de données récoltées sur 3 ans (2010-2012) où le personnel de terrain a récolté, pour chaque observation: la date, le type de végétation, les coordonnées GPS.
Chaque observation peut concerner, OU NON le braconnage. Je dispose donc au final de plusieurs variables:
- une variable dépendante BINAIRE Y (="poaching") correspondant à la présence ou non d'indices relatifs au braconnage (pièges, armes, animaux braconnés, etc).
- plusieurs variables indépendantes qualitatives ET quantitatives: année, saison, végétation, localisation, distance au camp de base, distance au camp de réfugiés
(Pour la variable localisation: 9 modalités correspondant à 9 zones différentes, dont une correspond à la zone d'étude principale où se situe le camp de base)
Pour répondre à mes questions j'ai donc réalisé une régression logistique avec Y= poaching et X1, X2, ..., X6 = vaiables indépendantes citées plus haut.
Question1: pensez-vous qu'il soit judicieux de faire un GLM incluant toutes les variables alors que je pose plusieurs questions relatives à seulement une de ces 6 variables à chaque fois?
J'ai utilisé un step AIC et une ANOVA pour sélectionner le meilleur modèle.
Question 2: pensez-vous que ce soit nécessaire d'utiliser ces méthodes comme mes questions concernent toutes une des 6 variables?
Question 3: comment interpréteriez-vous les résultats ci-dessous?
ATTENTION: seules 4 des 6 variables sont utilisées pour l'instant
seule une partie des résultats du step AIC est présentée ici
Résultats pour le step AIC
Résultats ANOVA:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 > glm1<-glm(Poaching~Year2+Season+Vegetation.type+Safari, family=binomial) > step(glm1) Start: AIC=3196.34 Poaching ~ Year2 + Season + Vegetation.type + Safari Df Deviance AIC <none> 3162.3 3196.3 - Season 3 3173.4 3201.4 - Year2 2 3173.6 3203.6 - Safari 7 3347.7 3367.7 - Vegetation.type 4 3377.4 3403.4 Call: glm(formula = Poaching ~ Year2 + Season + Vegetation.type + Safari, family = binomial) Coefficients: (Intercept) Year2011 Year2012 SeasonEarly Dry -4.476294 0.002093 -0.407947 0.206936
Merci beaucoup à qui prendra le temps de lire toutes ces explications et questions et merci INFINIMENT à qui y répondra!
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 > anova(glm1) Analysis of Deviance Table Model: binomial, link: logit Response: Poaching Terms added sequentially (first to last) Df Deviance Resid. Df Resid. Dev NULL 14957 3614.3 Year2 2 45.789 14955 3568.5 Season 3 20.834 14952 3547.7 Vegetation.type 4 199.916 14948 3347.7 Safari 7 185.408 14941 3162.3![]()
Partager