IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Regression avec variables non linéairement dépendantes


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Août 2010
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 17
    Par défaut Regression avec variables non linéairement dépendantes
    Bonjour à tous,

    J'essaie d'estimer un modèle à l'aide d'une régression logistique en ayant deux variables explicatives liées. Voici mon modèle :

    glm(Y ~ X1 + X2 + X3 * X4 + X3 + X4), family = binomial,data = XXX)

    X3 et X4 sont des variables binaires et ce sont elles qui sont linéairement dépendantes. Ainsi X3 représente deux années, disons 2000 et 2001 et X4 une politique économique binaire, par exemple verser une allocation chômage, qui n'existe pas en 2000 mais qui existe en 2001 mais ne touche pas tous les individus.

    Je pensais qu'il fallait mettre un signe * entre les variables linéairement dépendantes pour tenir compte de l'indépendance mais apparemment ce n'est pas la bonne solution puisque R m'indique "Coefficients: (1 not defined because of singularities)" tout en me sortant des résultats.

    Une idée ?

    Merci d'avance

  2. #2
    Membre chevronné
    Inscrit en
    Mars 2013
    Messages
    208
    Détails du profil
    Informations forums :
    Inscription : Mars 2013
    Messages : 208
    Par défaut
    Hello,

    L'erreur renvoyée signifie qu'une variable est combinaison linéaire d'autres variables du modèle.

    A ce que j'ai compris:

    X3=2000 (0 en binaire) => X4=Pas d'allocation (0 en binaire)
    X3=2001 (1 en binaire)=> on ne peut rien conclure sur X4

    Du coup en binaire:
    X4 = X3:X4
    d'où l'erreur puisque dans ton modèle tu met à la fois X4 et X3:X4 qui sont deux variables identiques!

    Conclusion: enlève X4 (ou X3:X4 au choix):
    glm(Y ~ X1 + X2 + X3 :X4 + X3 ), family = binomial,data = XXX)

    NB: Attention à l'operateur * dans une formule.
    X3*X4 ca correspond à X3+X4+X3:X4.
    Si tu veux juste le croisement, tu utilises ":" .

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Août 2010
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 17
    Par défaut
    Merci beaucoup pour la réponse je n'avais pas reussi à la trouver sur internet

    Juste une dernière question pour être sur d'obtenir ce que je cherche. J'aimerais avoir l'effet de la politique mise en place (X4) en contrôlant par l'année (X3) afin d'être sur que l'effet observé ne provienne pas d'un changement de l'échantillon entre les années.
    J'obtiens les résultats suivant :

    X3 -1.8e-01 1.3e-01 -1.4 0.16
    X3:X4 modalité 1 1.4e-04 6.9e-05 2.0 0.05

    La ligne qui m’intéresse (voir si la politique mise en place entre les deux années a un effet) est donc bien X3:X4 ?

    En fait je me permets encore deux petites questions :
    -Aurais tu une source sur l'utilisation de ":" dans les régressions ?
    -Peut on l'utiliser de la même manière dans les régressions logistiques multinomiales ?

    Merci d'avance

  4. #4
    Membre chevronné
    Inscrit en
    Mars 2013
    Messages
    208
    Détails du profil
    Informations forums :
    Inscription : Mars 2013
    Messages : 208
    Par défaut
    Citation Envoyé par lmoulin Voir le message
    Merci beaucoup pour la réponse je n'avais pas reussi à la trouver sur internet

    J'obtiens les résultats suivant :

    X3 -1.8e-01 1.3e-01 -1.4 0.16
    X3:X4 modalité 1 1.4e-04 6.9e-05 2.0 0.05

    La ligne qui m’intéresse (voir si la politique mise en place entre les deux années a un effet) est donc bien X3:X4 ?
    Oui.
    Et effectivement, la politique a un effet significatif puisque la p value est de 5%.
    Ce n'est clairement pas le cas de l'année (p value de 16%).


    En fait je me permets encore deux petites questions :
    -Aurais tu une source sur l'utilisation de ":" dans les régressions ?
    Oui: Moi
    Tu peux me citer ca me dérange pas.

    Aha nan serieusement si on demandait une source à chaque fois que quelqu'un répond à un problème de syntaxe R


    -Peut on l'utiliser de la même manière dans les régressions logistiques multinomiales ?
    Merci d'avance
    Le ":" n'est aucunement une syntaxe propre à la fonction glm.
    Il est propre aux objets de type formule.
    En clair ca marche avec toute sorte de regression si tu veux tant que tu utilises un objet de type formula.

    Au passage la "source" que tu voullais c'est l'aide de R sur formula si ca te tient vraiment à coeur ^^

    Citation Envoyé par R Documentation
    An expression of the form y ~ model is interpreted as a specification that the response y is modelled by a linear predictor specified symbolically by model. Such a model consists of a series of terms separated by + operators. The terms themselves consist of variable and factor names separated by : operators. Such a term is interpreted as the interaction of all the variables and factors appearing in the term.

    In addition to + and :, a number of other operators are useful in model formulae. The * operator denotes factor crossing: a*b interpreted as a+b+a:b.

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Août 2010
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 17
    Par défaut
    De nouveau merci pour tes réponses qui vont m'être d'une grande utilité

    Sujet résolu

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 1
    Dernier message: 26/07/2012, 12h44
  2. Régression linéaire avec contraintes non-linéaires
    Par TimeSeries dans le forum SAS STAT
    Réponses: 0
    Dernier message: 20/04/2010, 10h56
  3. [MySQL] requête SQL avec variables non renseignées
    Par Boris56 dans le forum PHP & Base de données
    Réponses: 4
    Dernier message: 08/03/2010, 14h50
  4. [debutant] get image avec une variable non static
    Par laguna dans le forum Langage
    Réponses: 2
    Dernier message: 06/03/2006, 15h57
  5. Réponses: 5
    Dernier message: 12/05/2005, 10h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo