IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Prédire valeurs années suivantes


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Homme Profil pro
    Analyse système
    Inscrit en
    Juin 2018
    Messages
    180
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Aveyron (Midi Pyrénées)

    Informations professionnelles :
    Activité : Analyse système
    Secteur : Alimentation

    Informations forums :
    Inscription : Juin 2018
    Messages : 180
    Par défaut Prédire valeurs années suivantes
    Bonjour à tous,
    J'utilise un fichier de donnée qui étudie la population francaise de 1982 à nos jours. Pour chaque année, la population au 1er janvier, le nombre de personne vivante, le nombre de décès. Télécharger ici : https://drive.google.com/open?id=1o9...8Sry_Q2h36T9w1

    J'aimerais pouvoir trouver les valeurs possible en 2019, 2020, etc. Anticiper avec des probabilités en quelques sortes. Je connais 2 techniques, mais elles me proposent 2 résultats différents, et j'aimerais savoir laquelle prendre.

    Première technique :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    reg <- lm(data$Solde ~ Rang , data = data ) #Création de la courbe
    
    coeff=coefficients(reg) #Récupération de l'équation de la courbe; je trouve y = -451.6*x + 251744.9
    
    predict(reg, newdata = data.frame( Rang = nrow(data)+ 1 )) #Afficher la valeur de l'année n + 1, soit 2019. Je trouve un solde de 234584.7

    Deuxième technique; utilisation du package "forecast" :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    library(forecast)
     
    arima <- auto.arima(ts(data$Solde, start = 1982, frequency = 1))
     
    predict(arima)$pred #La, je trouve [1] 159494.4
     
    forecast( arima , h = 1)
    Conclusion, la première technique qui reprend complètement l'équation de la droite, m'affiche un solde de 234584.7 pour l'année 2019

    La deuxième technique qui utilise je ne sais quel algorytme, m'affiche :

    Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
    2019 159494.4 129879.6 189109.3 114202.4 204786.4


    Lequel croire ?

  2. #2
    Membre expérimenté
    Homme Profil pro
    Data scientist
    Inscrit en
    Février 2017
    Messages
    211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data scientist
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2017
    Messages : 211
    Par défaut
    Bonjour,

    Je vais regarder celà.

  3. #3
    Membre confirmé
    Homme Profil pro
    Analyse système
    Inscrit en
    Juin 2018
    Messages
    180
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Aveyron (Midi Pyrénées)

    Informations professionnelles :
    Activité : Analyse système
    Secteur : Alimentation

    Informations forums :
    Inscription : Juin 2018
    Messages : 180
    Par défaut
    Merci à vous

  4. #4
    Membre expérimenté
    Homme Profil pro
    Data scientist
    Inscrit en
    Février 2017
    Messages
    211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data scientist
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2017
    Messages : 211
    Par défaut
    Bonjour,

    ta série solde n'est pas linéaire réalisé une régression linéaire n'est pas trop juste ( fonction lm ) . plutôt une régression polynomiale qui sera le plus juste

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
     
    reg <- lm(data$Solde ~ poly(Rang, 5)  , data = data )
    on remarque une tendance plutôt à baisse depuis 2006 presque linéaire peut être se limiter à des données à partir de 2006 et réaliser une régression linéaire.

    ou essayer une moyenne mobile aussi ca peut te donner une prédiction plus réaliste.

  5. #5
    Membre confirmé
    Homme Profil pro
    Analyse système
    Inscrit en
    Juin 2018
    Messages
    180
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Aveyron (Midi Pyrénées)

    Informations professionnelles :
    Activité : Analyse système
    Secteur : Alimentation

    Informations forums :
    Inscription : Juin 2018
    Messages : 180
    Par défaut
    Merci pour ta réponse,
    Mais ... en quoi ma série n'est-elle pas linéaire ? J'ai du mal à comprendre.
    Merci

  6. #6
    Membre expérimenté
    Homme Profil pro
    Data scientist
    Inscrit en
    Février 2017
    Messages
    211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data scientist
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2017
    Messages : 211
    Par défaut
    On ne peut pas l'ajuster par une ligne.

    Il faut revoir la théorie des modèles statistiques avant de se lancer dans la modélisation.


    Nom : Sans titre.png
Affichages : 110
Taille : 12,5 Ko

Discussions similaires

  1. Réponses: 4
    Dernier message: 29/11/2011, 17h02
  2. Réponses: 3
    Dernier message: 13/10/2011, 13h28
  3. Problème récupérer la valeur du suivant dans un tableau
    Par ageofempiresz dans le forum C++/CLI
    Réponses: 2
    Dernier message: 10/06/2011, 23h46
  4. [MySQL] Modifier des valeurs SQL suivant la date
    Par Arthezius dans le forum PHP & Base de données
    Réponses: 3
    Dernier message: 08/07/2008, 17h43
  5. [POI]Récupérer valeur cellule suivant format
    Par leminipouce dans le forum Documents
    Réponses: 1
    Dernier message: 27/10/2005, 08h52

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo