IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Compter le nombre de doublons dans une colonne


Sujet :

R

  1. #1
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2017
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 29
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2017
    Messages : 20
    Points : 13
    Points
    13
    Par défaut Compter le nombre de doublons dans une colonne
    Bonjour à tous!

    J'ai importé un fichier .csv dans un data.frame.
    Dans une colonne j'ai le nom de plusieurs utilisateurs. Certains apparaissent une fois, d'autres apparaissent plusieurs fois.
    J'aimerai compter le nombre de fois que chaque utilisateur à été "cité" dans cette colonne.

    Il me semble que la fonction duplicated() pourrait m'aider, seulement elle renvoie, en valeur logique, si l'élément est dupliqué ou non. Mais ne me donne pas l'information de combien de fois et cela pour chaque utilisateur.

    J'ai donc essayé de stocker dans un second data.frame les utilisateurs uniques dans une colonne et le nombre de fois ou ils apparaissaient dans mon premier data.frame. Seulement je m'emmêle les pinceaux... Auriez-vous une idée pour me débloquer ?

    Je vous remercie,
    Justine

  2. #2
    Membre expérimenté
    Inscrit en
    Novembre 2009
    Messages
    703
    Détails du profil
    Informations forums :
    Inscription : Novembre 2009
    Messages : 703
    Points : 1 311
    Points
    1 311
    Par défaut Compter le nombre de doublons dans une colonne
    Bonjour,

    Pourquoi ne pas faire simplement un tableau de fréquences ?

    Cordialement,

  3. #3
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2017
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 29
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2017
    Messages : 20
    Points : 13
    Points
    13
    Par défaut
    Je ne savais pas que c'était possible ...

    Cela est possible pour le nombre d'apparition dans une colonne ?
    Quelle est la fonction à utiliser ?

    Merci

  4. #4
    Membre expérimenté
    Inscrit en
    Novembre 2009
    Messages
    703
    Détails du profil
    Informations forums :
    Inscription : Novembre 2009
    Messages : 703
    Points : 1 311
    Points
    1 311
    Par défaut Tableau de fréquences
    Voir la fonction table().

    Cordialement,

  5. #5
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2017
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 29
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2017
    Messages : 20
    Points : 13
    Points
    13
    Par défaut
    Et bien super ! merci beaucoup

    Bonne journée
    Justine

  6. #6
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2017
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 29
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2017
    Messages : 20
    Points : 13
    Points
    13
    Par défaut
    Re-bonjour.

    Est ce possible avec la fonction table() de garder uniquement ceux qui ressortent plus de 10 fois ? (Ceux dont la fréquence est supérieure à 10)

    Merci

  7. #7
    Membre expérimenté
    Inscrit en
    Novembre 2009
    Messages
    703
    Détails du profil
    Informations forums :
    Inscription : Novembre 2009
    Messages : 703
    Points : 1 311
    Points
    1 311
    Par défaut Compter le nombre de doublons dans une colonne
    Bonjour,

    Vous pouvez charger le résultat de la fonction table() dans un dataframe puis faire une sélection dessus :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    > df <- data.frame(V1=c("A","A","A","B","B","C","C","C","C","C"))
    > V1.freq <- as.data.frame(table(df$V1))
    > V1.freq[V1.freq$Freq >= 3,]
      Var1 Freq
    1    A    3
    3    C    5
    Cordialement,

  8. #8
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2017
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 29
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2017
    Messages : 20
    Points : 13
    Points
    13
    Par défaut
    Ha merci,
    Je ne savais pas que par défaut la deuxième colonne était nommée Freq...

    Cordialement,
    Justine

  9. #9
    Membre expérimenté
    Inscrit en
    Novembre 2009
    Messages
    703
    Détails du profil
    Informations forums :
    Inscription : Novembre 2009
    Messages : 703
    Points : 1 311
    Points
    1 311
    Par défaut Compter le nombre de doublons dans une colonne
    Quand vous ne connaissez pas le nom des variables, vous pouvez commencer par afficher les premières lignes de l'objet à l'aide de la fonction head() ou sa structure à l'aide de la fonction str(). Ici il fallait d'abord charger le résultat de la fonction table() dans un dataframe.

    Cordialement,

  10. #10
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    Juin 2017
    Messages
    20
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 29
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2017
    Messages : 20
    Points : 13
    Points
    13
    Par défaut
    Oui j'avais chargé le résultat dans un data.frame déjà, mais je n'avais pas fait attention qu'il y avait des header par défaut !
    Merci beaucoup

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 2
    Dernier message: 03/06/2015, 11h53
  2. Compter le nombre de 1 dans une colonne
    Par paiva44 dans le forum Débutez
    Réponses: 2
    Dernier message: 28/01/2010, 18h33
  3. [MySQL] Compter le nombre d'entrées dans une colonne
    Par gastoncs dans le forum PHP & Base de données
    Réponses: 2
    Dernier message: 25/07/2009, 22h09
  4. Réponses: 6
    Dernier message: 04/11/2008, 22h35
  5. Compter un nombre de date dans une colonne
    Par MASK55 dans le forum Macros et VBA Excel
    Réponses: 8
    Dernier message: 07/11/2007, 11h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo