1) Remarque par rapport à la syntaxe de R : inutile de créer des variables intermédiaires x et y. Il suffit d'écrire :
r <- glm( presence.absence ~ suivi, data=vitdeg2, family=binomial)
2) Remarque par rapport à l'analyse : tu as explicitement la durée de survie et aucune donnée censurée puisque tu as les survies pour tous les nids. Que tu prennes toutes les informations ou que tu te limites à une période d'observation de 3 mois, dans ce cas, les survies de plus de trois mois sont des données censurées, une analyse de survie est plus adaptée, d'autant que la signification de la variable presence.absence n'est pas homogène dans le fichier. En effet, elle vaut par exemple 0 pour un suivi de 120 jours et une survie de 98 jours et 1 pour la même survie quand le suivi est de 87 jours.
3) Interprétation du résultat de glm. Le modèle logistique est : log( Pr( Y=1) / Pr( Y=0)) = b x. D'où Pr( Y=1) = exp( b x) / (1 + exp( b x)). Donc :
b = 0, les deux cas sont probables en fonction de x et Y est donc indépendant de x ;
b > 0, Y croit en fonction de x
b < 0, Y décroit en fonction de x.
4) Compte-tenu des points 2 et 3, l'analyse de survie donne une durée de vie médiane des nids tandis que l'analyse logistique donne un taux de présence des nids après la dizaines de valeurs du suivi qui devraient alors être considérées comme des niveaux d'un facteur plus que comme des variables numériques. Il est très hasardeux de vouloir interpoler le taux de présence entre ces valeurs et de considérer que la valeur du coefficient suivi de glm est représentatif d'un taux de disparition des nids en fonction du temps.
Partager