IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Supprimer des lignes selon le nombre d'occurrences d'une modalité


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2020
    Messages
    18
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2020
    Messages : 18
    Par défaut Supprimer des lignes selon le nombre d'occurrences d'une modalité
    Bonjour,
    J'ai un tableau à une colonne du style :

    COL1
    A
    A
    A
    A
    A
    B
    B
    B
    B
    B
    C
    D
    D
    D
    D
    E
    E

    Je souhaiterais que les lettres qui apparaissent moins de 3 fois soient supprimées (en l'occurrence ici le C et les E).

    J'ai essayé quelque chose comme :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    df_test = df_have[df_have.groupby('COL1').count() >= 3]
    mais cela ne fonctionne pas...

    Quelqu'un a une idée ? Merci d'avance !

  2. #2
    Membre prolifique
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 835
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 835
    Billets dans le blog
    1
    Par défaut
    Bonjour
    Citation Envoyé par Menthix Voir le message
    Quelqu'un a une idée ? Merci d'avance !
    Code python : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    >>> data="aaaabbbcdefff"
    >>> [x for x in data if data.count(x) >= 3]
    ['a', 'a', 'a', 'a', 'b', 'b', 'b', 'f', 'f', 'f']
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  3. #3
    Membre Expert
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    923
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 923
    Billets dans le blog
    8
    Par défaut
    Bonjour,
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    df.groupby('col1').filter(lambda x: x.count() >= 3)
    édit: modification code car copié/collé mal formé

  4. #4
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2020
    Messages
    18
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2020
    Messages : 18
    Par défaut
    J'ai l'erreur suivante : TypeError: filter function returned a Series, but expected a scalar bool
    en faisant ton code Hominidé

  5. #5
    Membre Expert
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    923
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 923
    Billets dans le blog
    8
    Par défaut
    pourtant:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    >>> import pandas as pd
    >>> df_have= {'col1': ["A","A","B","B","B","B","C"]}
    >>> df = pd.DataFrame(df_have)
    >>> df.groupby('col1').filter(lambda x: x.count() >= 3)
      col1
    2    B
    3    B
    4    B
    5    B
    >>>

  6. #6
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2020
    Messages
    18
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2020
    Messages : 18
    Par défaut
    Citation Envoyé par Hominidé Voir le message
    pourtant:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    >>> import pandas as pd
    >>> df_have= {'col1': ["A","A","B","B","B","B","C"]}
    >>> df = pd.DataFrame(df_have)
    >>> df.groupby('col1').filter(lambda x: x.count() >= 3)
      col1
    2    B
    3    B
    4    B
    5    B
    >>>
    Merci de ta réponse. Mon problème vient du fait que j'ai plus d'une colonne.
    Imagine que l'on ait :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    df_have= {'col1': ["A","A","B","B","B","B","C"], 'col2': ["B","O","N","J","O","U","R"]}
    df = pd.DataFrame(df_have)
    df
    Dès lors, si je reprend le code pour filtrer j'ai une erreur. Je souhaiterais à la fin avoir :
    df_want= {'col1': ["B","B","B","B"], 'col2': ["N","J","O","U"]}


    Merci d'avance !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XL-2010] Supprimer des lignes selon 3 critères et sur un onglet choisi
    Par breakage dans le forum Macros et VBA Excel
    Réponses: 1
    Dernier message: 09/10/2015, 07h29
  2. Réponses: 8
    Dernier message: 20/03/2015, 16h32
  3. Supprimer des lignes selon une condition
    Par j0joo dans le forum Macros et VBA Excel
    Réponses: 9
    Dernier message: 27/03/2014, 14h40
  4. [XL-2003] supprimer des lignes selon critères
    Par collinchris dans le forum Macros et VBA Excel
    Réponses: 2
    Dernier message: 14/01/2010, 13h51
  5. [XL-2003] VBA supprimer des ligne selon la date d'une cellule
    Par Scrabblouille dans le forum Macros et VBA Excel
    Réponses: 3
    Dernier message: 06/08/2009, 22h37

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo