Prédire valeurs années suivantes

**preliator** · 07/04/2019, 13h56

Bonjour à tous,
J'utilise un fichier de donnée qui étudie la population francaise de 1982 à nos jours. Pour chaque année, la population au 1er janvier, le nombre de personne vivante, le nombre de décès. Télécharger ici : https://drive.google.com/open?id=1o9...8Sry_Q2h36T9w1

J'aimerais pouvoir trouver les valeurs possible en 2019, 2020, etc. Anticiper avec des probabilités en quelques sortes. Je connais 2 techniques, mais elles me proposent 2 résultats différents, et j'aimerais savoir laquelle prendre.

Première technique :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
reg <- lm(data$Solde ~ Rang , data = data ) #Création de la courbe

coeff=coefficients(reg) #Récupération de l'équation de la courbe; je trouve y = -451.6*x + 251744.9

predict(reg, newdata = data.frame( Rang = nrow(data)+ 1 )) #Afficher la valeur de l'année n + 1, soit 2019. Je trouve un solde de 234584.7

Deuxième technique; utilisation du package "forecast" :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
 
library(forecast)
 
arima <- auto.arima(ts(data$Solde, start = 1982, frequency = 1))
 
predict(arima)$pred #La, je trouve [1] 159494.4
 
forecast( arima , h = 1)

Conclusion, la première technique qui reprend complètement l'équation de la droite, m'affiche un solde de 234584.7 pour l'année 2019

La deuxième technique qui utilise je ne sais quel algorytme, m'affiche :

Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
2019 159494.4 129879.6 189109.3 114202.4 204786.4

Lequel croire ?

**marou1991** · 08/04/2019, 11h31

Bonjour,

Je vais regarder celà.

**preliator** · 09/04/2019, 00h29

Merci à vous

**marou1991** · 09/04/2019, 12h45

Bonjour,

ta série solde n'est pas linéaire réalisé une régression linéaire n'est pas trop juste ( fonction lm ) . plutôt une régression polynomiale qui sera le plus juste

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
 
 
reg <- lm(data$Solde ~ poly(Rang, 5)  , data = data )

on remarque une tendance plutôt à baisse depuis 2006 presque linéaire peut être se limiter à des données à partir de 2006 et réaliser une régression linéaire.

ou essayer une moyenne mobile aussi ca peut te donner une prédiction plus réaliste.

**preliator** · 09/04/2019, 16h08

Merci pour ta réponse,
Mais ... en quoi ma série n'est-elle pas linéaire ? J'ai du mal à comprendre.
Merci

**marou1991** · 09/04/2019, 16h13

On ne peut pas l'ajuster par une ligne.

Il faut revoir la théorie des modèles statistiques avant de se lancer dans la modélisation.

Nom : Sans titre.png
Affichages : 114
Taille : 12,5 Ko

Nom : Sans titre.png
Affichages : 114
Taille : 12,5 Ko

Prédire valeurs années suivantes

R

Vue hybride

Discussions similaires

Partager

Partager