Bonjour à tous,
J'utilise un fichier de donnée qui étudie la population francaise de 1982 à nos jours. Pour chaque année, la population au 1er janvier, le nombre de personne vivante, le nombre de décès. Télécharger ici : https://drive.google.com/open?id=1o9...8Sry_Q2h36T9w1
J'aimerais pouvoir trouver les valeurs possible en 2019, 2020, etc. Anticiper avec des probabilités en quelques sortes. Je connais 2 techniques, mais elles me proposent 2 résultats différents, et j'aimerais savoir laquelle prendre.
Première technique :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 reg <- lm(data$Solde ~ Rang , data = data ) #Création de la courbe coeff=coefficients(reg) #Récupération de l'équation de la courbe; je trouve y = -451.6*x + 251744.9 predict(reg, newdata = data.frame( Rang = nrow(data)+ 1 )) #Afficher la valeur de l'année n + 1, soit 2019. Je trouve un solde de 234584.7
Deuxième technique; utilisation du package "forecast" :
Conclusion, la première technique qui reprend complètement l'équation de la droite, m'affiche un solde de 234584.7 pour l'année 2019
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 library(forecast) arima <- auto.arima(ts(data$Solde, start = 1982, frequency = 1)) predict(arima)$pred #La, je trouve [1] 159494.4 forecast( arima , h = 1)
La deuxième technique qui utilise je ne sais quel algorytme, m'affiche :
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
2019 159494.4 129879.6 189109.3 114202.4 204786.4
Lequel croire ?![]()
Partager