IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Analyse de texte "Mots doubles "


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2018
    Messages
    30
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 29
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Octobre 2018
    Messages : 30
    Par défaut Analyse de texte "Mots doubles "
    Bonjour,

    J'ai un texte et j'aimerai trouver tous les mots en double.

    J'ai commencé par faire un split() afin d'avoir tout le texte mots par mots dans une liste.
    Je pensai faire une boucle afin de comparer chaque mots lettres par lettres dans la liste , mais je pense que c'est pas la bonne méthode...
    Je n'ai pas trouvé de fonction appars findall() ou count() qui pourrait aider peut être.

    Quelqu'un aurait-il une idée ?

    Merci d'avance!

  2. #2
    Expert confirmé
    Avatar de fred1599
    Homme Profil pro
    Lead Dev Python
    Inscrit en
    Juillet 2006
    Messages
    4 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Lead Dev Python
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Juillet 2006
    Messages : 4 062
    Par défaut
    Bonsoir,

    Va voir du côté de counter

  3. #3
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2018
    Messages
    30
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 29
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Octobre 2018
    Messages : 30
    Par défaut
    Oui mais cette fonction la marche que lorsque l'on cherche un mot précis dans le texte..

    Je pensai faire ceux-ci:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    fichier=open('C:\\Users\\LATITUDE\\Desktop\\Le Diable au Corps.txt','r')
    T=[]
    for line in fichier:
        li=line.strip().split()
        T.append(li[:])
     
           for i in range len(T):
    print T.find_all(i)

  4. #4
    Expert confirmé
    Avatar de fred1599
    Homme Profil pro
    Lead Dev Python
    Inscrit en
    Juillet 2006
    Messages
    4 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Lead Dev Python
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Juillet 2006
    Messages : 4 062
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    from collections import Counter
     
    example = ["mot", "test", "mot", "exemple", "autre", "test", "test"]
     
     
    print(Counter(example))
    donne

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Counter({'test': 3, 'mot': 2, 'autre': 1, 'exemple': 1})
    Quels sont les mots en double ?

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    res_dict = Counter(example)
     
    for w in res_dict:
        if res_dict[w] == 2:
            print(w)
    affiche bien "mot"

  5. #5
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2018
    Messages
    30
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 29
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Octobre 2018
    Messages : 30
    Par défaut
    Merci super ça marche !

    J'avais confondu la fonction count() et counter(). Une fonction bien pratique ...

    Deuxième question :

    Lorsque je décompose le texte j'ai des numéros et caractère comme : '\x92\xe0' qui apparaissent

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    ['Jusqu\x92\xe0',
     'douze',
     'ans,',
     'je',
     'ne',
    ....]
    Je pensais utiliser la fonction strip() , mais ça ne change rien...

    Auriez-vous une idée ?

  6. #6
    Expert confirmé
    Avatar de fred1599
    Homme Profil pro
    Lead Dev Python
    Inscrit en
    Juillet 2006
    Messages
    4 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Lead Dev Python
    Secteur : Arts - Culture

    Informations forums :
    Inscription : Juillet 2006
    Messages : 4 062
    Par défaut
    la liste n'est pas un objet qu'on affiche, très souvent, on va formater pour avoir la réponse souhaitée avec un print pour son affichage.

    Que fait un print(liste[0]) où liste est la liste que vous nous présentez ?

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Texte défilant avec double buffering
    Par trinie dans le forum 2D
    Réponses: 2
    Dernier message: 28/04/2006, 15h06
  2. [HTML] remplissage de ma zone de texte par mot composé?
    Par zorba49 dans le forum Balisage (X)HTML et validation W3C
    Réponses: 2
    Dernier message: 07/09/2005, 16h59

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo