IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Analyse d'une régression linéaire multiple


Sujet :

R

  1. #1
    Nouveau membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2017
    Messages
    40
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Mayenne (Pays de la Loire)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2017
    Messages : 40
    Points : 35
    Points
    35
    Par défaut Analyse d'une régression linéaire multiple
    Bonjour,

    J'ai réalisé une régression linéaire multiple sur R mais j'ai quelques soucis d'analyse du résultat. Après la régression, j'obtiens le résumé suivant :

    Nom : Sans titre.png
Affichages : 2734
Taille : 32,2 Ko

    J'en déduis que la variable V6 a statistiquement un impact sur la variable V1.

    Le R2 est cependant plutôt faible. J'aimerai justement chercher à l'améliorer mais je ne vois pas comment faire.

    Je vérifie ensuite mon modèle statistique.

    Nom : Sans titre.png
Affichages : 1136
Taille : 13,6 Ko

    Nom : Sans titre.png
Affichages : 1112
Taille : 5,0 Ko

    La répartition des résidus à l'air correct mais je ne suis pas sur de mon analyse.

    Pouvez vous m'aider à analyser cette régression s'il vous plait ?

    Cordialement,

    Jonathan

  2. #2
    Membre averti
    Homme Profil pro
    Ingénieur en études décisionnelles
    Inscrit en
    Février 2013
    Messages
    134
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Ingénieur en études décisionnelles

    Informations forums :
    Inscription : Février 2013
    Messages : 134
    Points : 351
    Points
    351
    Par défaut
    Hello,

    Ce forum n'a pas vraiment vocation à aider à l'analyse et l'interprétation statistique, mais plutôt à aiguiller sur le code R, les fonctions que tu peux utiliser, etc.
    Ceci étant dit.

    Tu mets dans ton modèle un nombre trop élevé de variables, dont en plus, beaucoup ne sont pas significatives. J'imagine que tu as mis tout ce que tu avais à disposition ?
    Tu es en train de faire un sur-apprentissage, et de fait, à nuire à la qualité de ton modèle.
    L'étape de sélection des variables est importante, c'est tout un art.

    La régression linéaire multiple est soumise à des hypothèses, dont par exemple la non colinéarité entre les variables explicatives. Pour vulgariser, ça veut dire que si tu as des variables explicatives très corrélées, il suffit d'en garder l'une d'entre elles pour le modèle (l'information des autres variables étant résumée dans celles que tu as conservée). Il faut être prudent et garder un œil critique bien sûr, pas hésiter à tracer les nuages de points pour s'assurer des corrélations...


    Je te propose donc d'analyser déjà la matrice des corrélations entre tes variables explicatives pour savoir lesquelles conserver.
    J'utilise pour ma part la fonction corrplot du package éponyme. Le visuel renvoyé est assez sexy.



    Une fois que tu auras tes variables explicatives ayant peu de corrélations entre elles, je te propose de te renseigner sur la méthode stepwize, qui permet de faire cette sélection automatiquement.

    Elle s'utilise ainsi :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    install.packages("MASS")
     
    library(MASS)
    step.fit <- stepAIC(model, direction="both")
    summary(step.fit)

    Normalement tu devrais faire monter ton R² avec un modèle ayant des variables mieux sélectionnées.

    Au fait, pourquoi forcément une régression linéaire multiple ?
    Tu as essayé de regarder les résultats avec une régression linéaire simple en gardant seulement V6 ?

  3. #3
    Nouveau membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2017
    Messages
    40
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Mayenne (Pays de la Loire)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2017
    Messages : 40
    Points : 35
    Points
    35
    Par défaut
    Bonjour Emmanuel,

    Merci pour le développement de ta réponse.

    Je vais regarder cela plus en détails. J'ai aussi effectué une régression simple avec le facteur V6 et elle montre une interaction avec ma variable V1.

    Bonne journée.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. LaTeX PGFplots / Tikzpicture tracer une régression linéaire
    Par galaxie87 dans le forum Tableaux - Graphiques - Images - Flottants
    Réponses: 0
    Dernier message: 16/07/2010, 22h09
  2. régression linéaire multiple
    Par azertyuio dans le forum Méthodes prédictives
    Réponses: 14
    Dernier message: 18/04/2010, 21h53
  3. régression linéaire multiple et contrainte
    Par arthy dans le forum Méthodes prédictives
    Réponses: 21
    Dernier message: 20/02/2010, 11h27
  4. Réponses: 2
    Dernier message: 22/12/2006, 20h24
  5. [NaN] Calcul d'une régression linéaire
    Par GLDavid dans le forum Langage
    Réponses: 1
    Dernier message: 24/10/2006, 12h55

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo