Bonjour à tous,

Mes questions concernent l'interprétation de résultats de deux méthodes que l'on m'a suggéré pour comparer des GLM: le step AIC et l'ANOVA. Je pense que pour y répondre vous devez connaitre un peu le contexte de mon étude; voilà pour quoi j'ai décidé de le développer ci-dessous:

J'essaie de répondre à diverses questions relatives au braconnage dans le cadre d'une étude des effets des activités anthropiques sur la faune sauvage dans une région en Tanzanie.

Voici les questions auxquelles je souhaiterais répondre:
- Est-ce que les braconniers ont plus tendance à chasser dans un certain type de végétation?
- Est-ce qu'ils ont plus tendance à chasser durant une certaine saison?
- Est-ce que le braconnage évolue au fil des ans?
- Est-ce que la présence des chercheurs influence la répartition du braconnage?
- Est-ce que la présence d'un camp de réfugiés proche de la zone d'étude influence la répartition du braconnage?

Je dispose pour cela de données récoltées sur 3 ans (2010-2012) où le personnel de terrain a récolté, pour chaque observation: la date, le type de végétation, les coordonnées GPS.

Chaque observation peut concerner, OU NON le braconnage. Je dispose donc au final de plusieurs variables:

- une variable dépendante BINAIRE Y (="poaching") correspondant à la présence ou non d'indices relatifs au braconnage (pièges, armes, animaux braconnés, etc).
- plusieurs variables indépendantes qualitatives ET quantitatives: année, saison, végétation, localisation, distance au camp de base, distance au camp de réfugiés

(Pour la variable localisation: 9 modalités correspondant à 9 zones différentes, dont une correspond à la zone d'étude principale où se situe le camp de base)

Pour répondre à mes questions j'ai donc réalisé une régression logistique avec Y= poaching et X1, X2, ..., X6 = vaiables indépendantes citées plus haut.

Question1: pensez-vous qu'il soit judicieux de faire un GLM incluant toutes les variables alors que je pose plusieurs questions relatives à seulement une de ces 6 variables à chaque fois?

J'ai utilisé un step AIC et une ANOVA pour sélectionner le meilleur modèle.

Question 2: pensez-vous que ce soit nécessaire d'utiliser ces méthodes comme mes questions concernent toutes une des 6 variables?

Question 3: comment interpréteriez-vous les résultats ci-dessous?


ATTENTION: seules 4 des 6 variables sont utilisées pour l'instant
seule une partie des résultats du step AIC est présentée ici

Résultats pour le step AIC
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
> glm1<-glm(Poaching~Year2+Season+Vegetation.type+Safari, family=binomial)
> step(glm1)
Start:  AIC=3196.34
Poaching ~ Year2 + Season + Vegetation.type + Safari
 
                  Df Deviance    AIC
<none>                 3162.3 3196.3
- Season           3   3173.4 3201.4
- Year2            2   3173.6 3203.6
- Safari           7   3347.7 3367.7
- Vegetation.type  4   3377.4 3403.4
 
Call:  glm(formula = Poaching ~ Year2 + Season + Vegetation.type + Safari, 
    family = binomial)
 
Coefficients:
          (Intercept)                 Year2011                 Year2012        SeasonEarly Dry  
            -4.476294               0.002093              -0.407947               0.206936
Résultats ANOVA:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
> anova(glm1)
Analysis of Deviance Table
 
Model: binomial, link: logit
 
Response: Poaching
 
Terms added sequentially (first to last)
 
 
                Df Deviance Resid. Df Resid. Dev
NULL                            14957     3614.3
Year2            2   45.789     14955     3568.5
Season           3   20.834     14952     3547.7
Vegetation.type  4  199.916     14948     3347.7
Safari           7  185.408     14941     3162.3
Merci beaucoup à qui prendra le temps de lire toutes ces explications et questions et merci INFINIMENT à qui y répondra!