1. #1
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    juin 2017
    Messages
    19
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 23
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : juin 2017
    Messages : 19
    Points : 12
    Points
    12

    Par défaut Compter le nombre de doublons dans une colonne

    Bonjour à tous!

    J'ai importé un fichier .csv dans un data.frame.
    Dans une colonne j'ai le nom de plusieurs utilisateurs. Certains apparaissent une fois, d'autres apparaissent plusieurs fois.
    J'aimerai compter le nombre de fois que chaque utilisateur à été "cité" dans cette colonne.

    Il me semble que la fonction duplicated() pourrait m'aider, seulement elle renvoie, en valeur logique, si l'élément est dupliqué ou non. Mais ne me donne pas l'information de combien de fois et cela pour chaque utilisateur.

    J'ai donc essayé de stocker dans un second data.frame les utilisateurs uniques dans une colonne et le nombre de fois ou ils apparaissaient dans mon premier data.frame. Seulement je m'emmêle les pinceaux... Auriez-vous une idée pour me débloquer ?

    Je vous remercie,
    Justine

  2. #2
    Membre confirmé
    Inscrit en
    novembre 2009
    Messages
    302
    Détails du profil
    Informations forums :
    Inscription : novembre 2009
    Messages : 302
    Points : 593
    Points
    593

    Par défaut Compter le nombre de doublons dans une colonne

    Bonjour,

    Pourquoi ne pas faire simplement un tableau de fréquences ?

    Cordialement,

  3. #3
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    juin 2017
    Messages
    19
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 23
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : juin 2017
    Messages : 19
    Points : 12
    Points
    12

    Par défaut

    Je ne savais pas que c'était possible ...

    Cela est possible pour le nombre d'apparition dans une colonne ?
    Quelle est la fonction à utiliser ?

    Merci

  4. #4
    Membre confirmé
    Inscrit en
    novembre 2009
    Messages
    302
    Détails du profil
    Informations forums :
    Inscription : novembre 2009
    Messages : 302
    Points : 593
    Points
    593

    Par défaut Tableau de fréquences

    Voir la fonction table().

    Cordialement,

  5. #5
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    juin 2017
    Messages
    19
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 23
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : juin 2017
    Messages : 19
    Points : 12
    Points
    12

    Par défaut

    Et bien super ! merci beaucoup

    Bonne journée
    Justine

  6. #6
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    juin 2017
    Messages
    19
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 23
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : juin 2017
    Messages : 19
    Points : 12
    Points
    12

    Par défaut

    Re-bonjour.

    Est ce possible avec la fonction table() de garder uniquement ceux qui ressortent plus de 10 fois ? (Ceux dont la fréquence est supérieure à 10)

    Merci

  7. #7
    Membre confirmé
    Inscrit en
    novembre 2009
    Messages
    302
    Détails du profil
    Informations forums :
    Inscription : novembre 2009
    Messages : 302
    Points : 593
    Points
    593

    Par défaut Compter le nombre de doublons dans une colonne

    Bonjour,

    Vous pouvez charger le résultat de la fonction table() dans un dataframe puis faire une sélection dessus :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    > df <- data.frame(V1=c("A","A","A","B","B","C","C","C","C","C"))
    > V1.freq <- as.data.frame(table(df$V1))
    > V1.freq[V1.freq$Freq >= 3,]
      Var1 Freq
    1    A    3
    3    C    5
    Cordialement,

  8. #8
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    juin 2017
    Messages
    19
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 23
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : juin 2017
    Messages : 19
    Points : 12
    Points
    12

    Par défaut

    Ha merci,
    Je ne savais pas que par défaut la deuxième colonne était nommée Freq...

    Cordialement,
    Justine

  9. #9
    Membre confirmé
    Inscrit en
    novembre 2009
    Messages
    302
    Détails du profil
    Informations forums :
    Inscription : novembre 2009
    Messages : 302
    Points : 593
    Points
    593

    Par défaut Compter le nombre de doublons dans une colonne

    Quand vous ne connaissez pas le nom des variables, vous pouvez commencer par afficher les premières lignes de l'objet à l'aide de la fonction head() ou sa structure à l'aide de la fonction str(). Ici il fallait d'abord charger le résultat de la fonction table() dans un dataframe.

    Cordialement,

  10. #10
    Membre à l'essai
    Femme Profil pro
    Étudiant
    Inscrit en
    juin 2017
    Messages
    19
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 23
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : juin 2017
    Messages : 19
    Points : 12
    Points
    12

    Par défaut

    Oui j'avais chargé le résultat dans un data.frame déjà, mais je n'avais pas fait attention qu'il y avait des header par défaut !
    Merci beaucoup

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 2
    Dernier message: 03/06/2015, 11h53
  2. Compter le nombre de 1 dans une colonne
    Par paiva44 dans le forum Débutez
    Réponses: 2
    Dernier message: 28/01/2010, 18h33
  3. Compter le nombre d'entrées dans une colonne
    Par gastoncs dans le forum PHP & MySQL
    Réponses: 2
    Dernier message: 25/07/2009, 22h09
  4. Réponses: 6
    Dernier message: 04/11/2008, 22h35
  5. Compter un nombre de date dans une colonne
    Par MASK55 dans le forum Macros et VBA Excel
    Réponses: 8
    Dernier message: 07/11/2007, 11h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo