IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Supprimer lignes ne contenant pas le pattern "_sp"


Sujet :

R

  1. #1
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Novembre 2014
    Messages
    13
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Réunion

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Associations - ONG

    Informations forums :
    Inscription : Novembre 2014
    Messages : 13
    Points : 16
    Points
    16
    Par défaut Supprimer lignes ne contenant pas le pattern "_sp"
    Bonjour à tous,

    je souhaite supprimer les lignes d'un data frame pour lesquelles le code_taxon ne contient pas le pattern "_sp" en fin de chaîne de caractères

    j'ai, par exemple, réussi à coder dans le sens inverse (c'est à dire garder les lignes qui contiennent un code_taxon avec le pattern "_sp")

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    taxon_sp <- grep(pattern = "_sp" , bdd$taxon, value = TRUE, fixed = TRUE)
    bdd1 <- subset(bdd, bdd$taxon %in% taxon_sp)
    je souhaiterai arriver à :

    - signaler que le pattern "_sp" se trouve en fin de chaîne de caractères car si je code :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    taxon_sp <- grep(pattern = "_sp$" , bdd$taxon, value = TRUE, fixed = TRUE)
    cela renvoi vecteur vide ...

    - sélectionner l'inverse (non "_sp") ou en supprimant les lignes qui ne sont pas dans ce vecteur taxon_sp

    Je pense qu'il doit exister d'autres fonctions car grep ou subset et %in% ne marche que dans le sens = et pas !=

    J'espère avoir été assez claire ..
    Merci pour votre aide !

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Pour sélectionner l'inverse, ie. les éléments qui ne contiennent pas "_sp", est-ce que quelque chose comme ce qui suit ne fonctionnerait pas ?

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    taxon_sp <- grep(pattern = "_sp" , bdd$taxon, value = TRUE, fixed = TRUE)
    bdd1 <- subset(bdd, !(bdd$taxon %in% taxon_sp) )  # utilisation de la négation logique !
    Pour le reste, voir peut-être du côté des autres paramètres de la fonction "grep"...

    HTH


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  3. #3
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Novembre 2014
    Messages
    13
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Réunion

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Associations - ONG

    Informations forums :
    Inscription : Novembre 2014
    Messages : 13
    Points : 16
    Points
    16
    Par défaut
    ça marche ! Merci beaucoup !
    C'est vrai que je ne sais jamais trop où placer cette négation logique ...

  4. #4
    Membre éclairé
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Points : 793
    Points
    793
    Par défaut
    Deux petites améliorations par rapport à la solution de Moderatrice :
    1) grep a un argument invert qui permet d'éviter la négation dans la sélection
    2) grep renvoie les indices des éléments qui correspondant au critère quand value vaut FALSE. Il suffit alors d'écrire :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    idx <- grep( "_sp", bdd$taxon, fixed=TRUE, invert=TRUE)
    bdd1 <- bdd[idx,]

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Toutes versions] Macro Suppression lignes ne contenant pas telle ou telle valeur
    Par gaett dans le forum Excel
    Réponses: 25
    Dernier message: 13/05/2016, 13h52
  2. [RegEx] Supprimer parenthèses ne contenant pas un mot précis
    Par Dev222 dans le forum Langage
    Réponses: 1
    Dernier message: 25/01/2015, 16h26
  3. [RegEx] Trouver les lignes ne contenant pas une expression
    Par venturi dans le forum Langage
    Réponses: 6
    Dernier message: 14/08/2013, 17h52
  4. [RegEx] [PCRE] Trouver les lignes ne contenant pas un mot
    Par NinjDS dans le forum Langage
    Réponses: 8
    Dernier message: 14/05/2012, 16h28
  5. Réponses: 2
    Dernier message: 27/04/2012, 17h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo