Bonjour à tous,
J'utilise un fichier de donnée qui étudie la population francaise de 1982 à nos jours. Pour chaque année, la population au 1er janvier, le nombre de personne vivante, le nombre de décès. Télécharger ici : https://drive.google.com/open?id=1o9...8Sry_Q2h36T9w1

J'aimerais pouvoir trouver les valeurs possible en 2019, 2020, etc. Anticiper avec des probabilités en quelques sortes. Je connais 2 techniques, mais elles me proposent 2 résultats différents, et j'aimerais savoir laquelle prendre.

Première technique :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
reg <- lm(data$Solde ~ Rang , data = data ) #Création de la courbe

coeff=coefficients(reg) #Récupération de l'équation de la courbe; je trouve y = -451.6*x + 251744.9

predict(reg, newdata = data.frame( Rang = nrow(data)+ 1 )) #Afficher la valeur de l'année n + 1, soit 2019. Je trouve un solde de 234584.7

Deuxième technique; utilisation du package "forecast" :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
 
library(forecast)
 
arima <- auto.arima(ts(data$Solde, start = 1982, frequency = 1))
 
predict(arima)$pred #La, je trouve [1] 159494.4
 
forecast( arima , h = 1)
Conclusion, la première technique qui reprend complètement l'équation de la droite, m'affiche un solde de 234584.7 pour l'année 2019

La deuxième technique qui utilise je ne sais quel algorytme, m'affiche :

Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
2019 159494.4 129879.6 189109.3 114202.4 204786.4


Lequel croire ?