IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Doublons et première occurence


Sujet :

R

  1. #1
    Nouveau Candidat au Club
    Femme Profil pro
    Chargée de projet
    Inscrit en
    Mai 2016
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 34
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Chargée de projet
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Mai 2016
    Messages : 1
    Points : 1
    Points
    1
    Par défaut Doublons et première occurence
    Bonjour,

    je dispose d'un dataframe (dt), comprenant 3 colonnes (A, B, C) et plus de 80000 lignes, ma colonne A comprend des éléments uniques et des doublons :

    A B C
    1 x y
    1 x y
    2 x y
    3
    3
    3
    4
    ...

    Je souhaiterais extraire de mon dataframe les enregistrements (lignes) où les valeurs de ma colonne A sont uniques et ceux qui sont multiples, selon l'exemple ci-dessous le résultat souhaité serait:
    - pour les données uniques:
    A B C
    2 x y
    4 x y

    - pour les données multiples:
    A B C
    1 x y
    1 x y
    3 x y
    3 x y
    3 x y

    Je débute tout juste avec le langage R, j'ai trouvé la fonction 'doublon' ou 'unique', mais lorsque je l'applique uniquement les doublons sont reconnus et la première occurrence n'est pas incluse, d'où mon problème...
    Une autre alternative serait peut-être l'utilisation d'une boucle 'for' ou de la fonction 'apply', qu'en pensez vous ?

    Merci pour vos retours,

    Camille

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Il y a peut-être moyen de faire mieux, mais une option pour récupérer un vecteur TRUE/FALSE qui va dire pour chaque valeur de A si elle apparait plus d'une fois ou non :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    doublons <- duplicated(dt$A) | duplicated(dt$A, fromLast = TRUE)
    HTH !


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

Discussions similaires

  1. Limiter une requête aux X premières occurences
    Par lbar012001 dans le forum Requêtes et SQL.
    Réponses: 6
    Dernier message: 20/05/2009, 11h57
  2. sed : première occurence seulement
    Par mbibim63 dans le forum Shell et commandes GNU
    Réponses: 5
    Dernier message: 15/05/2009, 20h49
  3. Recherche de la première occurence d'un fichier
    Par defluc dans le forum Langage
    Réponses: 3
    Dernier message: 03/06/2008, 16h19
  4. arrêt à la première occurence du signe
    Par khasanouray dans le forum Langage
    Réponses: 3
    Dernier message: 03/08/2007, 17h48
  5. Première occurence d'une donnée
    Par bob33 dans le forum MS SQL Server
    Réponses: 3
    Dernier message: 10/06/2003, 13h50

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo