Bonjour,
Après moultes recherches, je me dirige vers vous.
L’étude concerne un ensemble de données agronomiques. Le logiciel utilisé est R.
Notre source de données est un fichier excel .csv avec 2 facteurs importants : l’ANNEE et la REGION et un certain nombre de variables.
Nous souhaiterions ajuster les valeurs de ces variables en tenant compte de la variabilité INTRA et INTER : ANNEE et LIEUX. Chaque valeur ajustée sera ensuite comparée à un seuil réglementaire, à partir duquel seront prises des décisions quant aux comportements des hybrides.
La finalité de notre étude consiste à discriminer les hybrides en les associant à des classes créées de manière arbitraire : « SENSIBLE », « TOLERANT », etc…
Pour cela, nous avions pensé à un modèle linéaire prenant en compte l’effet ANNEE et REGION et l’interaction des deux.
=> 3 effets très significatifs.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 model = aov ( extraction$Y ~ as.factor(extraction$"Année") * as.factor(extraction$"Region") , na.action = na.omit) summary (model)
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 FIT = as.data.frame ( model$fitted.values ) > head(FIT) model$fitted.values 1 2.8 2 2.8 3 2.8 6 2.8 7 2.8 8 2.8
On retrouve bien : e = y - ý
De manière intuitive, nous aurions pensé que model$fitted.values renverrait les valeurs ajustées tenant compte de ces effets ANNEE et REGION.
Or, les données émises par R sont toutes semblables pour un même facteur.
Ce n’est pas ce que nous cherchons.
Pourriez-vous nous aiguiller dans ce type d’analyse ?
En vous remerciant,
Partager