Interpréter une sortie de régression sous R
Bonjour, je viens de m'inscrire et je trouve le forum fabuleux.
Je commence à peine à pratiquer la régression alors je voudrais que vous me donniez un coup de main dans l'interprétation de cette sortie.
modelfinal : comptage ~ periode + saison+ site + pH+ profondeur + saison : site.
L’estimation des coefficients de régressions est donnée par le tableau suivant avec * = p < 0.05, † = p < 0.1, e = exposant :
Citation:
Tableau :
Coef estimé Erreur type Z.value
Intercept 0.21918 5.92588 0.037
période -0.1033 0.04974 -2.078 *
saison pluie 12.56195 7.74165 1.623
site plantation 1.87827 1.19141 1.577
pH 0.97635 0.58718 1.663 †
profondeur -3.56348 2.15145 -1.656 †
saison pluie : site plantation -5.41656 2.41490 -2.243 *
AIC= 100.82
En fait, je voudrais savoir si les variables explicatives (période, saison, pH, profondeur, site) et les interactions ont un effet sur l'indice de détectabilité du Lamantin en précisant les différentes cotes.
Merci.
Voila un petit commentaire
Bonjour,
Normalement, ce forum traite de procédures R qu'on soumet. Toutefois, pour ce qui est de ta question, qui concerne plutôt les statistiques, voilà: Tout d'abord, il y a un préalable à une analyse de régression multiple, il faut tester si tes variables explicatives (à gauche du signe ~) sont corrélées ou non. En cas de corrélation entre deux variables explicatives, on parle de colinéarité, et maintenir ces deux variables dans le même modèle va générer des résultats erronés. D'habitude, on privilégie de retenir dans le modèle la variable auto corrélée qui présente le plus d'intérêt et on enlève la variable avec laquelle elle est corrélée.
Sur la table que tu présentes, chaque ligne correspond à une sortie d'une variable explicative. Si cela se trouve que la variable avec une probabilité (p) inférieure à 0.05, on dit que cette variable a un effet significatif sur la variable que tu cherches à expliquer (comptage). De plus cela ne sert pas à grand-chose de surparaméter un modèle de régression. Le AIC qui apparait en fin de modèle sert justement à sélectionner le meilleur modèle qui explique la variable "comptage". Le modèle définitif que tu retiens est celui pour lequel on a un AIC plus faible car il faut toujours privilégier la parcimonie en modélisation en ne retenant que le plus petit nombre de variable tant que cela est possible (retiens-le bien, le AIC est ton ami pour cela). Voilà en gros, espérant que cela te sera utile.