Interprétation GLM et question à propos
Bonjour à tous,
J'ai donc un fichier de données qui est le suivant :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13
|
data
storage variete tunnel brix_chair
1 PS S 26 13.9
2 PS S 26 15.2
3 PS S 26 16.2
4 PS S 26 15.3
5 PS S 26 14.6
6 PS S 26 17.0
7 PS S 26 16.5
8 MT5 S 26 14.6
9 MT5 S 26 15.8
10 MT5 S 26 16.6 |
Donc on a storage en 6 niveaux, tunnel à 2 et variete a 2 aussi.
Je souhaite savoir quel traitement de stockage modifie le moins mon brix, je m'explique, j'ai pas de stockage (PS) et 5 autres modalités, voir du coup quellle modalité se rapproche le plus de PS.
Aussi je souhaite savoir dans quel stockage nous avons le brix le plus élevé, dans quel tunnel et dans quelle variété, le sens de mes facteurs si je ne dis pas de bêtises.
On m'a conseillé un GLM je l'ai exécuté et pu obtenir cette formule avec la commande summary juste après :
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
|
> glm.3 <- glm(formula = brix_chair ~ storage + tunnel + variete + storage:tunnel +
+ tunnel:variete, family = gaussian("identity"), data = data)
> summary(glm.3)
Call:
glm(formula = brix_chair ~ storage + tunnel + variete + storage:tunnel +
tunnel:variete, family = gaussian("identity"), data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.0931 -0.7710 0.0721 0.7629 3.2839
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 16.5633 0.3208 51.635 < 2e-16 ***
storageBT5 -1.8472 0.4753 -3.886 0.000150 ***
storageMT12 -1.4314 0.3904 -3.666 0.000337 ***
storageMT5 -0.2898 0.4899 -0.592 0.554939
storageMTBT -1.5967 0.7475 -2.136 0.034244 *
storagePS -0.6395 0.3864 -1.655 0.099969 .
tunnel26 -1.0068 0.4556 -2.210 0.028577 *
varieteS -0.7307 0.2830 -2.582 0.010738 *
storageBT5:tunnel26 2.2972 0.6300 3.646 0.000362 ***
storageMT12:tunnel26 -0.0177 0.5796 -0.031 0.975684
storageMT5:tunnel26 0.5632 0.6455 0.872 0.384284
storageMTBT:tunnel26 1.1167 0.8576 1.302 0.194802
storagePS:tunnel26 0.4422 0.5662 0.781 0.435910
tunnel26:varieteS 0.7746 0.3751 2.065 0.040588 *
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Dispersion parameter for gaussian family taken to be 1.367656)
Null deviance: 287.33 on 169 degrees of freedom
Residual deviance: 213.35 on 156 degrees of freedom
AIC: 551.06
Number of Fisher Scoring iterations: 2 |
Donc j'aimerai avoir des précisions sur cette sortie, pourquoi met-t-il qu'un seul niveau de tunnel ? Il n'y a que le 26
Même chose pour la variété, il n'y a que la S.
Ma dernière question est de savoir ce que signifie les p-valeurs, si elle est très significative cela veut dire qu'il y a beaucoup de brix dans cette modalité ? Ou que cette modalité est significative pour le modèle et du coup quelle est l'interprétation derrière significative ?
Au niveau des interactions entre facteurs aussi quelles interprétations pourrait-on faire ?
Si vous avez une idée je suis preneur je suis totalement débutant dans ce type de sortie R.
Bien à vous,
NS