IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

aide pour script répétition des mots (poussé)


Sujet :

Python

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2017
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Janvier 2017
    Messages : 9
    Points : 7
    Points
    7
    Par défaut aide pour script répétition des mots (poussé)
    Bonjour,
    Je vous explique, j'ai un txt avec plusieurs extension de type:

    Hotmail.fr
    Hotmail.com
    gmx.de
    etc
    etc

    Et j'aimerais que le script retire les doublons MAIS! qu'il note a coté de chaque extension combien il y avait de doublon par exemple :
    Hotmail.fr : 5
    Hotmail.com : 1
    gmx.de : 56
    etc
    etc

    ps : je ne peux pas faire de dictionnaire car j'ai environ 100.000 extensions différentes.

    merci d'avance pour vos proposition.

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 241
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 241
    Points : 36 698
    Points
    36 698
    Par défaut
    Salut,

    Citation Envoyé par siwalex Voir le message
    ps : je ne peux pas faire de dictionnaire car j'ai environ 100.000 extensions différentes.
    Je ne comprends pas le problème:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    >>> from collections import Counter
    >>> lines = [ 'zzzzz%03d' % x for x in range(20) ]
    >>> lines = lines * (1000 * 50)
    Donc on a fabriqué une liste d'un millions de lignes:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    >>> len(lines)
    1000000
    >>>
    Et çà se compte assez bien:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    >>> Counter(lines)
    Counter({'zzzzz000': 50000, 'zzzzz013': 50000, 'zzzzz010': 50000, 'zzzzz008': 50
    000, 'zzzzz005': 50000, 'zzzzz004': 50000, 'zzzzz006': 50000, 'zzzzz003': 50000,
     'zzzzz007': 50000, 'zzzzz016': 50000, 'zzzzz015': 50000, 'zzzzz002': 50000, 'zz
    zzz017': 50000, 'zzzzz014': 50000, 'zzzzz009': 50000, 'zzzzz018': 50000, 'zzzzz0
    11': 50000, 'zzzzz001': 50000, 'zzzzz019': 50000, 'zzzzz012': 50000})
    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2017
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Janvier 2017
    Messages : 9
    Points : 7
    Points
    7
    Par défaut re
    Et bien j'ai un fichier txt avec plusieurs mots sous cette forme :

    hotmail.fr
    hotmail.com
    hotmail.fr
    hotmail.fr
    hotmail.de
    hotmail.fr

    et je souhaite savoir combien il y a de mot hotmail.fr , hotmail.com etc

  4. #4
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 241
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 241
    Points : 36 698
    Points
    36 698
    Par défaut
    Citation Envoyé par siwalex Voir le message
    Et bien j'ai un fichier txt avec plusieurs mots sous cette forme :

    hotmail.fr
    hotmail.com
    hotmail.fr
    hotmail.fr
    hotmail.de
    hotmail.fr

    et je souhaite savoir combien il y a de mot hotmail.fr , hotmail.com etc
    C'est quoi le soucis? Pour apprendre à ouvrir et lire un fichier, le plus simple est d'ouvrir un tuto... et d'essayer de comprendre le code précédent.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2017
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Janvier 2017
    Messages : 9
    Points : 7
    Points
    7
    Par défaut re
    Alors non,
    je sais comment ouvrir et lire un fichier mais je ne sais comment faire pour qu'ils compte chaques doublons present et me dire en combien d'exemplaires sont ils.
    je n'ai aucunes idées...
    et j'ai beau chercher partout des idée de code mais en vain ...

  6. #6
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 241
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 241
    Points : 36 698
    Points
    36 698
    Par défaut
    Citation Envoyé par siwalex Voir le message
    et j'ai beau chercher partout des idée de code mais en vain ...
    Je vous ai déjà donné une solution dans ce message... Si vous n'avez pas le temps de lire ou d'essayer de comprendre ces quelques lignes de code, je ne peux pas grand chose pour vous. Désolé.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  7. #7
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2017
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Janvier 2017
    Messages : 9
    Points : 7
    Points
    7
    Par défaut re
    j'ai tout lu,
    j'ai reussi a en faire quelque chose mais le probleme est toujours le meme :
    numéroter le nombre de fois ou le mot apparait... je ne trouve ca nul part du moins je n'arrive pas a intergrer de compteur dans le script...
    j'ai besoin d'aide s'il vous plait

  8. #8
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 241
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 241
    Points : 36 698
    Points
    36 698
    Par défaut
    Citation Envoyé par siwalex Voir le message
    j'ai tout lu,
    j'ai reussi a en faire quelque chose mais le probleme est toujours le meme :
    numéroter le nombre de fois ou le mot apparait... je ne trouve ca nul part du moins je n'arrive pas a intergrer de compteur dans le script...
    Ce comptage est fait par Counter qui est un "dictionnaire".
    Ses fonctionnalités sont décrites ici.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  9. #9
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2017
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Janvier 2017
    Messages : 9
    Points : 7
    Points
    7
    Par défaut re
    merci !
    je crois avoir trouver une solution.
    en revanche en executant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    import re
    words = re.findall(r'\w+', open('1.txt').read().lower())
    counter(words).most_common(10)
    mon fichier 1.txt n'est pas vide,

    j'ai ce message :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    Traceback (most recent call last):
      File "C:\Users\Siwal\AppData\Local\Programs\Python\Python35-32\Scripts\compter les doublons.py", line 4, in <module>
        counter(words).most_common(10)
    NameError: name 'counter' is not defined
    pourquoi donc ?
    merci d'avance

  10. #10
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2017
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Janvier 2017
    Messages : 9
    Points : 7
    Points
    7
    Par défaut re
    Citation Envoyé par wiztricks Voir le message
    Ce comptage est fait par Counter qui est un "dictionnaire".
    Ses fonctionnalités sont décrites ici.

    - W
    du coup ... pour mon message d'erreur ... j'ai resolu

Discussions similaires

  1. [mIRC] besoin d'aide pour scripting
    Par emile13 dans le forum IRC / mIRC
    Réponses: 5
    Dernier message: 03/03/2007, 01h05
  2. Besoin d'aide pour un MCD des tables de la BDD
    Par nicaud dans le forum Schéma
    Réponses: 3
    Dernier message: 23/04/2006, 11h34
  3. aide pour script php/mysql
    Par jem27 dans le forum Débuter
    Réponses: 18
    Dernier message: 27/03/2006, 19h08
  4. aides pour script en shell
    Par komatek dans le forum Langages de programmation
    Réponses: 2
    Dernier message: 12/08/2003, 16h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo