Bonjour à tous,
J'ai donc un fichier de données qui est le suivant :
Donc on a storage en 6 niveaux, tunnel à 2 et variete a 2 aussi.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13 data storage variete tunnel brix_chair 1 PS S 26 13.9 2 PS S 26 15.2 3 PS S 26 16.2 4 PS S 26 15.3 5 PS S 26 14.6 6 PS S 26 17.0 7 PS S 26 16.5 8 MT5 S 26 14.6 9 MT5 S 26 15.8 10 MT5 S 26 16.6
Je souhaite savoir quel traitement de stockage modifie le moins mon brix, je m'explique, j'ai pas de stockage (PS) et 5 autres modalités, voir du coup quellle modalité se rapproche le plus de PS.
Aussi je souhaite savoir dans quel stockage nous avons le brix le plus élevé, dans quel tunnel et dans quelle variété, le sens de mes facteurs si je ne dis pas de bêtises.
On m'a conseillé un GLM je l'ai exécuté et pu obtenir cette formule avec la commande summary juste après :
Donc j'aimerai avoir des précisions sur cette sortie, pourquoi met-t-il qu'un seul niveau de tunnel ? Il n'y a que le 26
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39 > glm.3 <- glm(formula = brix_chair ~ storage + tunnel + variete + storage:tunnel + + tunnel:variete, family = gaussian("identity"), data = data) > summary(glm.3) Call: glm(formula = brix_chair ~ storage + tunnel + variete + storage:tunnel + tunnel:variete, family = gaussian("identity"), data = data) Deviance Residuals: Min 1Q Median 3Q Max -3.0931 -0.7710 0.0721 0.7629 3.2839 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 16.5633 0.3208 51.635 < 2e-16 *** storageBT5 -1.8472 0.4753 -3.886 0.000150 *** storageMT12 -1.4314 0.3904 -3.666 0.000337 *** storageMT5 -0.2898 0.4899 -0.592 0.554939 storageMTBT -1.5967 0.7475 -2.136 0.034244 * storagePS -0.6395 0.3864 -1.655 0.099969 . tunnel26 -1.0068 0.4556 -2.210 0.028577 * varieteS -0.7307 0.2830 -2.582 0.010738 * storageBT5:tunnel26 2.2972 0.6300 3.646 0.000362 *** storageMT12:tunnel26 -0.0177 0.5796 -0.031 0.975684 storageMT5:tunnel26 0.5632 0.6455 0.872 0.384284 storageMTBT:tunnel26 1.1167 0.8576 1.302 0.194802 storagePS:tunnel26 0.4422 0.5662 0.781 0.435910 tunnel26:varieteS 0.7746 0.3751 2.065 0.040588 * --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 (Dispersion parameter for gaussian family taken to be 1.367656) Null deviance: 287.33 on 169 degrees of freedom Residual deviance: 213.35 on 156 degrees of freedom AIC: 551.06 Number of Fisher Scoring iterations: 2
Même chose pour la variété, il n'y a que la S.
Ma dernière question est de savoir ce que signifie les p-valeurs, si elle est très significative cela veut dire qu'il y a beaucoup de brix dans cette modalité ? Ou que cette modalité est significative pour le modèle et du coup quelle est l'interprétation derrière significative ?
Au niveau des interactions entre facteurs aussi quelles interprétations pourrait-on faire ?
Si vous avez une idée je suis preneur je suis totalement débutant dans ce type de sortie R.
Bien à vous,
NS
Partager