IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Boucle sur régression logistique


Sujet :

R

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mai 2017
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : Santé

    Informations forums :
    Inscription : Mai 2017
    Messages : 12
    Points : 7
    Points
    7
    Par défaut Boucle sur régression logistique
    BOnjour,
    J'ai une erreur lorsque j'exécute une boucle avec des régressions logistiques, alors que hors de la boucle, le script fonctionne parfaitement pour toutes les valeurs que devrait prendre le compteur 'x' dans la boucle (j'obtiens mes résultats de régression en appliquant successivement x<-1 ; x<-2 ; etc avant de lancer le script contenu dans la boucle).
    Le problème étant que je suis amené à refaire cette manip plusieurs fois et qu'à la longue ça prend du temps de faire tourner une boucle à la main...

    Mon code est le suivant :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
     
    sink("MonFichier.txt")
      for (x in 1:length(L)) {
        A<-paste0("M_",L[x])
        B<-paste0("Ms_",L[x])
        eval(parse(text=paste0(A," <- glm(",L[x]," ~ ",paste(E, collapse="+"),",family='binomial',data=MaSource)")))
        eval(parse(text=paste0(B," <- glm(",L[x]," ~ ",paste(E, collapse="+"),"+",paste(S, collapse="+"),",family='binomial',data=MaSource)")))
     
        print(eval(parse(text=paste0("summary(",A,")"))))
        print("Odds Ratio")
        print(eval(parse(text=paste0("exp(coefficients(",A,"))"))))
        print(eval(parse(text=paste0("summary(",B,")"))))
        print("Odds Ratio")
        print(eval(parse(text=paste0("exp(coefficients(",B,"))"))))
      }
      sink()
    Où L contient les noms des variables à expliquer successivement
    E et S contiennent les variables explicatives

    Le tout sous en utilisant RStudio version 1.4.1103

    Si quelqu'un peut me donner une piste, je lui en saurai infiniment gré !

  2. #2
    Futur Membre du Club
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mai 2017
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : Santé

    Informations forums :
    Inscription : Mai 2017
    Messages : 12
    Points : 7
    Points
    7
    Par défaut
    J'ai oublié de préciser : le message d'erreur est le suivant :
    "Error in weights * y : argument non numérique pour un opérateur binaire"

  3. #3
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Bonjour.
    Aucun souci avec le code ci-dessous, inspiré du tien.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    data(iris)
     
    E <- c("Sepal.Width")
    S <- c("Sepal.Length")
     
    L <- c("Petal.Width","Petal.Length")
     
    for (x in seq_along(L)){
      A<-paste0("M_",L[x])
      B<-paste0("Ms_",L[x])
      eval(parse(text=paste0(A," <- lm(",L[x]," ~ ",paste(E, collapse="+"),",data=iris)")))
      eval(parse(text=paste0(B," <- lm(",L[x]," ~ ",paste(E, collapse="+"),"+",paste(S, collapse="+"),",data=iris)")))
     
      print(eval(parse(text=paste0("summary(",A,")"))))
      print(eval(parse(text=paste0("summary(",B,")"))))
    }
    Est-ce que le message d'erreur apparaît à toutes les itérations de la boucle ou seulement à certaines ?
    Es-tu sûr que le texte fourni à eval+parse est bien le code que tu attends ? (A priori oui mais à vérifier)
    As-tu bien vérifié les types de tes variables ? (en particulier celles que tu veux expliquer)
    Y a-t-il des pondérations dans tes modèles ?
    Bon courage.
    Olivier

  4. #4
    Futur Membre du Club
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mai 2017
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : Santé

    Informations forums :
    Inscription : Mai 2017
    Messages : 12
    Points : 7
    Points
    7
    Par défaut
    BOnjour,

    Merci beaucoup Olivier pour ta suggestion.

    Je m'aperçois que je n'ai pas assez insisté sur un point : le bug survient pour les régressions logistiques (glm... family='binomial')
    J'ai fait le même script avec des régressions linéaires qui fonctionne parfaitement (pour des variables à expliquer différentes évidemment).

    Pour répondre à tes questions : la boule ne s'exécute pas du tout et je n'ai que le message d'erreur comme retour (une seule fois).
    Le code dans eval est bon : il fonctionne si je le sors de la boucle (et pour toutes les valeurs de x) !
    pareil pour les types de variables
    Et non : pas de pondération !!!

    C'est là qu'est tout le mystère... (pour moi en tout cas :-s

  5. #5
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Les variables à expliquer ont quoi comme min et max ?
    Bon courage.
    Olivier

  6. #6
    Futur Membre du Club
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mai 2017
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : Santé

    Informations forums :
    Inscription : Mai 2017
    Messages : 12
    Points : 7
    Points
    7
    Par défaut
    Toutes les variables à expliquer prennent les valeurs 0/1

  7. #7
    Futur Membre du Club
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mai 2017
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : Santé

    Informations forums :
    Inscription : Mai 2017
    Messages : 12
    Points : 7
    Points
    7
    Par défaut
    Hello!

    Finalement j'ai pu contourner le problème en utilisant une autre fonction (puisque le script fonctionnait très bien avec les régressions linéaires, je suppose que le problème vient d'un bug de la fonction glm)
    J'ai donc utilisé la fonction vglm du package VGAM. En outre elle me permet d'utiliser également des variables dépendantes ordinales

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
     
    sink("MonFichier.txt")
      for (x in 1:length(L)) {
        A<-paste0("M_",L[x])
        B<-paste0("Ms_",L[x])
        eval(parse(text=paste0(A," <- vglm(",L[x]," ~ ",paste(E, collapse="+"),",family=acat(),data=MaSource)")))
        eval(parse(text=paste0(B," <- vglm(",L[x]," ~ ",paste(E, collapse="+"),"+",paste(S, collapse="+"),",family=acat(),data=MaSource)")))
     
        print(eval(parse(text=paste0("summary(",A,")"))))
        print("Odds Ratio")
        print(eval(parse(text=paste0("exp(coefficients(",A,"))"))))
        print(eval(parse(text=paste0("summary(",B,")"))))
        print("Odds Ratio")
        print(eval(parse(text=paste0("exp(coefficients(",B,"))"))))
      }
      sink()
    Un grand merci à toi, Olivier pour le temps que tu as passé sur ma question ! Et si tu trouve une solution/explication ça m'intéresse toujours néanmoins...

Discussions similaires

  1. Réponses: 19
    Dernier message: 06/01/2016, 12h15
  2. [XSLT] Faire une boucle sur une variable [i]
    Par PoT_de_NuTeLLa dans le forum XSL/XSLT/XPATH
    Réponses: 8
    Dernier message: 07/06/2010, 12h45
  3. Réponses: 1
    Dernier message: 17/04/2007, 16h47
  4. L'installation d'XP boucle sur elle-même
    Par pf106 dans le forum Windows XP
    Réponses: 13
    Dernier message: 20/08/2005, 14h55
  5. [MFC] Boucle sur un bouton
    Par karl3i dans le forum MFC
    Réponses: 6
    Dernier message: 17/02/2004, 11h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo