IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Extraire un élément d'une colonne de noms de lignes


Sujet :

R

  1. #1
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2012
    Messages
    11
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2012
    Messages : 11
    Points : 11
    Points
    11
    Par défaut Extraire un élément d'une colonne de noms de lignes
    Bonjour, je bloque sur le problème suivant :

    J'ai une première colonne qui sert de noms aux individus.

    Elle est de type Nom,Prénom,Age,identifiant. Mais chez certains, ils peut y avoir d'autres infos en plus comme la ville ou autres. Dans tous les cas l’identifiant est en dernier.

    Exemple : Dupont,Jean-Luc,45,547842_fr

    Comment puis-je faire pour récupérer un vecteur avec les valeurs des différents identifiants ? (547842_fr). J'ai utilisé une strsplit pour séparer les éléments avec le délimiteur ",". Après je me demande ce que je pourrais faire pour récupérer l'identifiant tout seul. Il me faudrait un genre de commande qui me permet de rechercher la chaîne de caractère qui comprend "_fr" et de la récupérer. Ou alors une commande qui permet de récupérer la chaîne de caractère après le dernier ","

    Merci !

  2. #2
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 018
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 018
    Points : 23 710
    Points
    23 710
    Par défaut
    Bonjour,

    Quelques demandes de précisions pour être certain d'avoir bien compris votre problème :
    1. la première colonne est formée d'une chaine de caractères qui contient plusieurs informations séparées par virgules : "Dupont,Jean-Luc,45,547842_fr". C'est bien ça ?
    2. le schéma de construction est-il toujours celui que vous donnez : nom,prénom,num,code ? Ou est-ce que ce motif n'est pas toujours le même sur toutes les lignes ?
    3. ce que vous appelez "identifiant" (547842_fr) est-il toujours en dernière place ?
    4. cet identifiant est-il toujours de la même forme, à savoir un numéro suivi de "_fr" ?
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  3. #3
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2012
    Messages
    11
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2012
    Messages : 11
    Points : 11
    Points
    11
    Par défaut
    1. Oui, c'est bien ça.
    2. Non, il n'est pas toujours le même. Une information supplémntaire peut se glisser entre l'age et l'identifiant.
    3.Oui l’identifiant se trouve toujours en dernier
    4.Il y a aussi des _be ou _nl

  4. #4
    Membre averti
    Homme Profil pro
    Inscrit en
    Août 2007
    Messages
    125
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Août 2007
    Messages : 125
    Points : 339
    Points
    339
    Par défaut
    Citation Envoyé par wiwi8999 Voir le message
    3.Oui l’identifiant se trouve toujours en dernier
    Hello,
    Je ne suis pas certain de bien comprendre mais pourquoi ne pas simplement prendre le dernier élément alors ?
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    > ttt <- strsplit("Dupont,Jean-Luc,45,547842_fr",",")[[1]]
    > ttt
    [1] "Dupont"    "Jean-Luc"  "45"        "547842_fr"
    > ttt[length(ttt)]
    [1] "547842_fr"
    Bonne continuation

  5. #5
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2012
    Messages
    11
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2012
    Messages : 11
    Points : 11
    Points
    11
    Par défaut
    On dirait que ça fonctionne. Merci bien.

    Par contre, ça ne fonctionne que pour la première ligne. Comment pourrais-je l’appliquer à toutes les lignes ? Si je mets [1:300] ça ne fonctionne pas.

  6. #6
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 018
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 018
    Points : 23 710
    Points
    23 710
    Par défaut
    Supposons que le data frame que vous traitiez s'appelle dt.
    Pour obtenir le vecteur contenant tous les codes contenus dans la première colonne de votre data frame, voici une façon de faire :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    codes <- apply(dt[, 1, drop=F], 1, function(x) unlist(strsplit(x, ","))[length(unlist(strsplit(x, ",")))])
    A tester quand même, c'est fait à la va-vite...
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  7. #7
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2012
    Messages
    11
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2012
    Messages : 11
    Points : 11
    Points
    11
    Par défaut
    Merci mais je préférerais partir de l'idée de Hoccha qui fonctionne bien. Si ce n'est que je ne sais pas l'adapter à l'ensemble de la colonne. Elle ne me renvoie que l'identifiant de la ligne spécifiée entre [[ ]] et le [[1:300]] renvoie un "échec d'indexation récursive au niveau 2".

    J'ai tenté aussi avec une boucle for(i in 1:300) mais alors elle me renvoie seulement le 300éme identifiant.

  8. #8
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2012
    Messages
    11
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2012
    Messages : 11
    Points : 11
    Points
    11
    Par défaut
    J'ai trouvé une autre manière de faire mais il me manque juste une étape pour y arriver.

    Supposons que j'ai une liste de prénoms. Comment puis-je faire pour obtenir la liste des prénoms qui ne contiennent pas de "w" ?

    PS : je pense avoir trouvé avec :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    y=grep("w", prénoms, value = TRUE, invert=TRUE)

  9. #9
    Membre averti
    Homme Profil pro
    Inscrit en
    Août 2007
    Messages
    125
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Août 2007
    Messages : 125
    Points : 339
    Points
    339
    Par défaut
    A priori, oui... votre code
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    grep("w", prénoms, value = TRUE, invert=TRUE)
    devrait fonctionner... Ce n'est pas le cas??

  10. #10
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2012
    Messages
    11
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2012
    Messages : 11
    Points : 11
    Points
    11
    Par défaut
    Oui parfait.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Extraire la valeur d'une colonne
    Par AgriPhilou dans le forum IHM
    Réponses: 2
    Dernier message: 08/03/2009, 21h57
  2. Extraire des éléments d'une liste
    Par dug dans le forum SQL
    Réponses: 5
    Dernier message: 25/02/2009, 15h42
  3. Réponses: 3
    Dernier message: 21/01/2009, 13h49
  4. Copier les éléments d'une colonne dans une autre
    Par adam57 dans le forum PL/SQL
    Réponses: 2
    Dernier message: 05/12/2008, 15h23
  5. Réponses: 3
    Dernier message: 06/11/2006, 08h14

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo