IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

création de visite par passage par patient, sachant que le nombre de visite est différent


Sujet :

R

  1. #1
    Candidat au Club
    Homme Profil pro
    interne en médecine
    Inscrit en
    Décembre 2020
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : interne en médecine
    Secteur : Santé

    Informations forums :
    Inscription : Décembre 2020
    Messages : 5
    Points : 4
    Points
    4
    Par défaut création de visite par passage par patient, sachant que le nombre de visite est différent
    Bonjour,
    J'ai un petit soucis, j'ai une base de données avec 38000 patients chez qui on a mesuré plusieurs fois le taux d'hémoglobine.
    Ce qui m'intéresserait serait d'obtenir le minimum en taux d'hémoglobine par patient.
    Pour ce faire je voulais dans ce DF qui est en format long, créer une nouvelle variable qui sera la variable visite, qui correspondrait au nombre de mesure d'hémoglobine. En gros une mesure égale une visite, deux mesures égale 2 visites. Ensuite je voulais transformer ce tableau en Wide avec reshape puis créer une colonie contenant le minimum du taux d'hémoglobine.

    Néanmoins je suis bloqué sur la création de la variable visite, je n'arrive pas à faire ma boucle, et étant novice, je tourne en rond et ne comprend pas vraiment ce que j'écris non plus...

    Nom : Capture d’écran 2020-12-14 à 09.01.39.png
Affichages : 105
Taille : 76,7 Ko
    en pièce jointe une ébauche de ma base de donnée.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    for (i in 1:38438) {
      transf2$visit<-1
      condition<-FALSE
      while (condition==FALSE){
        if(transf2[i+1,1]!=transf2[i,1]){transf2$visit<-1;condition==TRUE} 
        else{transf2[i,4]<-transf2$visit+1}}}
    merci de votre aide...

  2. #2
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Bonjour Arthur.
    Dans R, on évitera en général de faire des boucles quand il s'agit de passer en revue les lignes d'un data.frame, parce qu'on dispose d'approches plus globales largement plus efficaces.
    La solution que je te propose utilise le package {dplyr} parce qu'il permet facilement de travailler sur des blocs de lignes (ici les lignes d'un même sujet) avec la fonction group_by.
    Il contient aussi une fonction row_number() qui crée un compteur initialisé automatiquement à 1 et qui s'incrémente à chaque ligne.

    Le principe de {dplyr}, en bref, si tu ne le connais pas déjà, est découper le travail sur les données en plusieurs étapes correspondant à autant de fonctions, que l'on peut enchaîner avec un connecteur %>%. Ici les étapes dont on a besoin sont group_by (pour travailler par blocs), mutate (pour calculer une nouvelle colonne) et ungroup (pour revenir à un comportement global sur tout ton data.frame, ça annule l'effet de group_by).

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    resultat <- transf2 %>%
       group_by(patient) %>%
       mutate(visite = row_number(),
                 min = min(hb, na.rm=TRUE),
                 max = max(hb, na.rm=TRUE)) %>%
      ungroup()
    Si tu ne veux garder qu'une ligne par patient, tu peux remplacer la fonction mutate par summarise (agrégation) mais dans ce cas il ne faudra pas calculer de numéro de visite, seulement le min et éventuellement le max.
    Bon courage.
    Olivier

  3. #3
    Candidat au Club
    Homme Profil pro
    interne en médecine
    Inscrit en
    Décembre 2020
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : interne en médecine
    Secteur : Santé

    Informations forums :
    Inscription : Décembre 2020
    Messages : 5
    Points : 4
    Points
    4
    Par défaut
    merci infiniment tu me sauves la vie, et c'est vrai que ça paraît 100000 fois plus simple comme ça.
    je garde l'astuce pour une prochaine fois

  4. #4
    Membre expérimenté
    Inscrit en
    Novembre 2009
    Messages
    703
    Détails du profil
    Informations forums :
    Inscription : Novembre 2009
    Messages : 703
    Points : 1 311
    Points
    1 311
    Par défaut Fonction aggregate()
    Bonjour,

    Vous pouvez regarder aussi la fonction aggregate() :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    aggregate(hb ~ patient, transf2, min, na.rm=TRUE)
    Cordialement,

Discussions similaires

  1. Réponses: 0
    Dernier message: 03/05/2011, 15h34
  2. Réponses: 2
    Dernier message: 10/02/2006, 14h46
  3. Création de fichier par SP
    Par MuadDib_CH dans le forum MS SQL Server
    Réponses: 4
    Dernier message: 24/07/2005, 11h36
  4. Réponses: 6
    Dernier message: 07/07/2004, 08h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo