Bonjour,
Je tente depuis plusieurs jours de trouver un modèle de régression qui puisse expliquer une série de donnée.
Il me semble avoir trouvé quelque chose de pas trop mal:
Et donc j'aimerais tenter de voir s'il est correct grâce à divers tests stats proposés par R:> fit<-lm(formula = QCum ~ F2Cum + I(F2Cum^2))
> summary(fit)
Call:
lm(formula = QCum ~ F2Cum + I(F2Cum^2))
Residuals:
Min 1Q Median 3Q Max
-0.44268 -0.21695 -0.04645 0.19003 0.78838
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.56728 0.27189 5.764 3.07e-08 ***
F2Cum 1.18843 0.27973 4.248 3.30e-05 ***
I(F2Cum^2) -0.27320 0.06979 -3.915 0.000124 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.2762 on 200 degrees of freedom
Multiple R-squared: 0.09924, Adjusted R-squared: 0.09023
F-statistic: 11.02 on 2 and 200 DF, p-value: 2.891e-05
durbinWatsonTest(fit, max.lag=1)
lag Autocorrelation D-W Statistic p-value
1 0.4258429 1.137207 0
Alternative hypothesis: rho != 0Alors je serais tenter de dire que d'après le test de Durbin-Watson j'ai une certaine autocorrélation de mes erreurs, serait-elle due à une inadéquation de mon modèle ?> library(gvlma)
> gvmodel <- gvlma(fit)
> summary(gvmodel)
Call:
lm(formula = QCum ~ F2Cum + I(F2Cum^2))
Residuals:
Min 1Q Median 3Q Max
-0.44268 -0.21695 -0.04645 0.19003 0.78838
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.56728 0.27189 5.764 3.07e-08 ***
F2Cum 1.18843 0.27973 4.248 3.30e-05 ***
I(F2Cum^2) -0.27320 0.06979 -3.915 0.000124 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.2762 on 200 degrees of freedom
Multiple R-squared: 0.09924, Adjusted R-squared: 0.09023
F-statistic: 11.02 on 2 and 200 DF, p-value: 2.891e-05
ASSESSMENT OF THE LINEAR MODEL ASSUMPTIONS
USING THE GLOBAL TEST ON 4 DEGREES-OF-FREEDOM:
Level of Significance = 0.05
Call:
gvlma(x = fit)
Value p-value Decision
Global Stat 18.8522 8.403e-04 Assumptions NOT satisfied!
Skewness 15.5872 7.879e-05 Assumptions NOT satisfied!
Kurtosis 0.2170 6.414e-01 Assumptions acceptable.
Link Function 2.3864 1.224e-01 Assumptions acceptable.
Heteroscedasticity 0.6616 4.160e-01 Assumptions acceptable.
Quand à la fonction gvlma(), je suis bien incapable d'interpréter les décisions qu'elle prend, ni ce à quoi correspond les différents test qu'elle effectue (Global Stat, Kurtosis)...
Pouvez vous me venir en aide ???
Merci !
Partager