Bonjour à tous,
J'ai un problème qui reste sans réponse malgré mes lectures. En fait, j'ai un projet sur les changements climatiques estivaux sur une période de 22 ans. Mes variables sont les dates (en format POSIXct), les températures maximales (numeric) et les mois de l'année de mai à septembre (numeric). Je cherche à faire un modèle linéaire de la température en fonction du temps (date) qui prend en considération la distribution quadratique des températures pour les mois de l'année (les températures étant plus basses en mai et en septembre). Tout ce que j'ai trouvé comme réponse me donne une régression quadratique, alors que je veux garder une régression linéaire, mais seulement prendre en compte l'effet quadratique. Mon principal problème est que les résidus ne respectent pas les conditions de normalité si je ne prend pas en compte l'effet quadratique de la variable mois.
Pour vous illustrer ce que je veux dire, voici la distribution de mes données (température en fonction des mois, l'effet quadratique que je veux prendre en considération):
Et le résultat de la régression souhaitée pour toutes mes données (celle-ci ne prend pas en considération l'effet quadratique et, par conséquent, ne respecte pas la condition de normalité):
Ma compréhension des modèles et des régressions n'est peut-être pas assez poussée pour bien comprendre ce que je fais. J'ai essayé des modèles polynomiaux, mais je ne sais pas si c'est la bonne chose à faire dans mon cas.
Est-ce que c'est valable comme formule? (Je n'en ai pas la moindre idée!) Serait-il plus approprié de faire un modèle à effet mixte et de mettre ma variable quadratique comme variable aléatoire? Ou toute autre suggestion? Je suis un peu perdue et j'avoue que j'aurais besoin d'explication!
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 Temp.annees1 <- lm(Max_T ~ Date + Month + poly(Month,2,raw=T), data = meteo_station) summary(Temp.annees1) Call: lm(formula = Max_T ~ Date + Month + poly(Month, 2, raw = T), data = meteo_station) Residuals: Min 1Q Median 3Q Max -18.292 -3.523 0.205 4.016 15.349 Coefficients: (1 not defined because of singularities) Estimate Std. Error t value Pr(>|t|) (Intercept) 3.939e+00 1.581e+00 2.491 0.013 * Date -4.780e-10 9.868e-10 -0.484 0.628 Month 9.973e+00 7.940e-01 12.560 <2e-16 *** poly(Month, 2, raw = T)1 NA NA NA NA poly(Month, 2, raw = T)2 -1.530e+00 1.305e-01 -11.727 <2e-16 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 Residual standard error: 5.61 on 655 degrees of freedom Multiple R-squared: 0.2032, Adjusted R-squared: 0.1995 F-statistic: 55.68 on 3 and 655 DF, p-value: < 2.2e-16
Pour vous donner une idée de mes données, j'ai joint un fichier excel à mon message.
TempEte_1995-2018.xlsx
Merci beaucoup et j'espère que mon message était assez clair pour que vous puissiez vous faire une idée!
Partager