IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

sortie de lm


Sujet :

R

  1. #1
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Février 2015
    Messages
    15
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Tarn et Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Février 2015
    Messages : 15
    Points : 11
    Points
    11
    Par défaut sortie de lm
    Bonjour,

    J'ai 3 variables explicatives quantitatives : lon, occ, b_index ayant respectivement comme R² : 0.42 , 0.01, et 0.03.

    Quand je fais des comparaisons de modèles avec la fonction anova entre :

    lm(VarQ ~ lon + occ) et lm (VarQ~ lon + occ + b_index) .

    L'anova me dit qu'il n'y a pas de différence significative entre ces deux modèles.

    Et je ne comprends pas pourquoi. La variable b_index (R² = 0.03) a pourtant un coefficient de détermination plus élevé que occ (R² = 0.01).

    Comment ce fait-il que le modèle final ne soit pas :

    lm(VarQ ~ lon + b_index) ou lm(VarQ ~ lon + b_index + occ) ?

    Merci pour votre aide.

  2. #2
    Membre averti
    Homme Profil pro
    Data Scientist
    Inscrit en
    Août 2013
    Messages
    139
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data Scientist
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2013
    Messages : 139
    Points : 316
    Points
    316
    Par défaut
    Bonjour,

    Je pense déjà qu'il est difficile d'interpréter le R^2 d'une seule variable et de dire ainsi si cette variable sera plus importante dans un modèle plus compliqué qu'une autre variable.

    Ensuite, le test utilisé pour comparer les modèles (test du rapport des vraisemblances) n'a pas grand chose à voir avec le R^2 d'où l'absence de lien entre ton R^2 et ce que le test de l'anova te dit...

    Je te conseille de regarder aussi la corrélation entre tes variables, voir si elles n'apportent pas la même information.

    Ensuite tu peux utiliser le R^2 ajusté pour avoir un R^2 plus "juste".

    De plus, regarde du coté des fonctions stepAIC (package mass) pour avoir un modèle qui optimise le choix du nombre de variables et la "justesse" de ce dernier.


    Bon courage !

  3. #3
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Février 2015
    Messages
    15
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Tarn et Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Février 2015
    Messages : 15
    Points : 11
    Points
    11
    Par défaut
    Bonjour,

    Merci pour votre réponse.
    Je viens de réaliser un test de corrélation entre mes deux variables, et la p-value est très inférieure à 0.05. J'en conclue donc qu'il n'y a pas de corrélation entre mes deux variables.
    J'ai également regarder comment optimiser la fonction stepAIC, mais je n'ai pas pu trouver de réglage pour "optimiser le choix du nombre de variables et la "justesse" de ce dernier".

    Mon problème reste donc entier.
    Je ne sais pas quelles variables inclure dans mon modèle et du coup sous quel critère.

  4. #4
    Membre averti
    Homme Profil pro
    Data Scientist
    Inscrit en
    Août 2013
    Messages
    139
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data Scientist
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2013
    Messages : 139
    Points : 316
    Points
    316
    Par défaut
    La méthode "classique" consiste à faire ton modèle complet et retirer les variables non nécessaire dans ton modèle avec un stepAIC qui trouvera le bon compromis entre complexité du modèle et bon ajustement.

    Ensuite tu peux aussi suppprimer les variables donc le coefficient n'est pas significatif avec un test de student par exemple.

    Ex :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    mod1 <- lm (VarQ~ lon + occ + b_index)
    anova(mod1)
    # Tu retires la variable qui est la "moins" significative
    mod2 <- lm (VarQ~ ...)
    Ou tu peux laisser le stepAIC.

    Je ne sais pas si tu as un échantillon de données conséquent ni ce que tu essayes de faire, mais tu peux regarder les effets croisés avec le modèle quadratique :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    mod1 <- lm (VarQ~ (lon + occ + b_index)^2)
    et procéder de même qu'avec l'autre modèle.

    Si tu essayes de faire de la prévision je te conseille de séparer ton échantillon en apprentissage / test pour vérifier la "justesse" (ou capacité de généralisation) de ton modèle en prédiction.


    Bref y a de quoi s'amuser avec les modèles !

  5. #5
    Membre averti
    Homme Profil pro
    Data Scientist
    Inscrit en
    Août 2013
    Messages
    139
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data Scientist
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2013
    Messages : 139
    Points : 316
    Points
    316
    Par défaut
    Ha et j'allais oublier !

    Je te conseille cette présentation sur le modèle linéaire avec R qui est très bien faite et te permettra de comprendre à la fois l'aspect statistique et l'aspect code R :
    http://rug.mnhn.fr/semin-r/PDF/semin...ros_110308.pdf

Discussions similaires

  1. Réponses: 16
    Dernier message: 18/07/2003, 17h16
  2. Comment rediriger la sortie vers /dev/null
    Par dclink dans le forum C
    Réponses: 4
    Dernier message: 24/06/2003, 18h23
  3. [LG]Entrées et sorties redirigée
    Par Lady dans le forum Langage
    Réponses: 17
    Dernier message: 10/05/2003, 18h33
  4. Rediriger le plux de sortie
    Par Groove dans le forum C
    Réponses: 5
    Dernier message: 17/04/2003, 17h16
  5. récupérer la valeur de sortie d'un thread
    Par jakouz dans le forum Langage
    Réponses: 3
    Dernier message: 31/07/2002, 11h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo