Bonjour à tous,
J'ai un problème qui reste sans réponse malgré mes lectures. En fait, j'ai un projet sur les changements climatiques estivaux sur une période de 22 ans. Mes variables sont les dates (en format POSIXct), les températures maximales (numeric) et les mois de l'année de mai à septembre (numeric). Je cherche à faire un modèle linéaire de la température en fonction du temps (date) qui prend en considération la distribution quadratique des températures pour les mois de l'année (les températures étant plus basses en mai et en septembre). Tout ce que j'ai trouvé comme réponse me donne une régression quadratique, alors que je veux garder une régression linéaire, mais seulement prendre en compte l'effet quadratique. Mon principal problème est que les résidus ne respectent pas les conditions de normalité si je ne prend pas en compte l'effet quadratique de la variable mois.
Pour vous illustrer ce que je veux dire, voici la distribution de mes données (température en fonction des mois, l'effet quadratique que je veux prendre en considération):
Nom : Temp vs Month.png
Affichages : 653
Taille : 5,8 Ko

Et le résultat de la régression souhaitée pour toutes mes données (celle-ci ne prend pas en considération l'effet quadratique et, par conséquent, ne respecte pas la condition de normalité):
Nom : Reglin.png
Affichages : 572
Taille : 7,1 Ko

Ma compréhension des modèles et des régressions n'est peut-être pas assez poussée pour bien comprendre ce que je fais. J'ai essayé des modèles polynomiaux, mais je ne sais pas si c'est la bonne chose à faire dans mon cas.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Temp.annees1 <- lm(Max_T ~ Date + Month + poly(Month,2,raw=T), data = meteo_station)
summary(Temp.annees1)
Call:
lm(formula = Max_T ~ Date + Month + poly(Month, 2, raw = T), 
    data = meteo_station)
 
Residuals:
    Min      1Q  Median      3Q     Max 
-18.292  -3.523   0.205   4.016  15.349 
 
Coefficients: (1 not defined because of singularities)
                           Estimate Std. Error t value Pr(>|t|)    
(Intercept)               3.939e+00  1.581e+00   2.491    0.013 *  
Date                     -4.780e-10  9.868e-10  -0.484    0.628    
Month                     9.973e+00  7.940e-01  12.560   <2e-16 ***
poly(Month, 2, raw = T)1         NA         NA      NA       NA    
poly(Month, 2, raw = T)2 -1.530e+00  1.305e-01 -11.727   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 
Residual standard error: 5.61 on 655 degrees of freedom
Multiple R-squared:  0.2032,	Adjusted R-squared:  0.1995 
F-statistic: 55.68 on 3 and 655 DF,  p-value: < 2.2e-16
Est-ce que c'est valable comme formule? (Je n'en ai pas la moindre idée!) Serait-il plus approprié de faire un modèle à effet mixte et de mettre ma variable quadratique comme variable aléatoire? Ou toute autre suggestion? Je suis un peu perdue et j'avoue que j'aurais besoin d'explication!

Pour vous donner une idée de mes données, j'ai joint un fichier excel à mon message.
TempEte_1995-2018.xlsx

Merci beaucoup et j'espère que mon message était assez clair pour que vous puissiez vous faire une idée!