IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Regex et python


Sujet :

Python

  1. #1
    Débutant  
    Inscrit en
    Novembre 2006
    Messages
    1 073
    Détails du profil
    Informations forums :
    Inscription : Novembre 2006
    Messages : 1 073
    Points : 217
    Points
    217
    Par défaut Regex et python
    Bonjour

    N'ayant aucune connaissance en regex, je sollicite votre aide dans l'espoire d'avoir une réponse.
    Je cherche a extraire une sous-chaine. Mettons que l'on ait les deux chaines suivantes

    201 W 21st St #9EF, New York
    451 W 24th St, New York,

    je chercher a extraire dans la premiere 21st, et dans la deuxième 24th.
    C'est a dire que je cherche a extraire la premiere sous chaine qui sera toujours a gauche de St, sachant que St peut aussi s'ecrire "ST" ou "st"

    Je vous remercie
    (Vous pouvez changer de forum ce message sil nest pas adapte)

  2. #2
    Membre expérimenté
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    870
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 870
    Points : 1 522
    Points
    1 522
    Billets dans le blog
    4
    Par défaut
    Bonjour,
    Vaste sujet.. voir https://docs.python.org/fr/3/library/re.html
    il y a plusieurs façon de faire. Je t'en livre une :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    import re
    pattern = '(\w+) [ST|st]'
    s = """201 W 21st St #9EF, New York
    451 W 24th St, New York, """
    print(re.findall(pattern, s))
    #Rien de nouveau sous le soleil, tout est vanité comme courir après le vent!
    Developpement pour Android avec Python3/Kivy/Buildozer

  3. #3
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Salut,

    Pourquoi utiliser des regex alors que votre chaine de caractères est "normalisée"? Ce que vous cherchez sera toujours à la 3ème place? (et que St peut aussi être écrit Street mais à la bonne place).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  4. #4
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 689
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 689
    Points : 30 983
    Points
    30 983
    Billets dans le blog
    1
    Par défaut
    Bonjour

    Si ton truc est toujours le 3° groupe de lettres, alors "201 W 21st St #9EF, New York".split()[2] devrait suffire sans passer par une regex...
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  5. #5
    Débutant  
    Inscrit en
    Novembre 2006
    Messages
    1 073
    Détails du profil
    Informations forums :
    Inscription : Novembre 2006
    Messages : 1 073
    Points : 217
    Points
    217
    Par défaut
    @Hominidé:

    Merci pour la reponse. J'ai essaye sur la chaine
    "201 W 21st St #9EF, New York"

    et cela me renvoie "21st S", alors que je veux "21st"


    @wiztricks,Sve@r:
    oui, cest une idée de splitter les chaines en sous chaines, mais je suis plus confiant avec les regex.

  6. #6
    Membre expérimenté
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    870
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 870
    Points : 1 522
    Points
    1 522
    Billets dans le blog
    4
    Par défaut
    Citation Envoyé par deubelte Voir le message
    @Hominidé:

    Merci pour la reponse. J'ai essaye sur la chaine
    "201 W 21st St #9EF, New York"

    et cela me renvoie "21st S", alors que je veux "21st"
    Je viens d'essayer avec ta chaine et j'obtiens bien :"21st"
    #Rien de nouveau sous le soleil, tout est vanité comme courir après le vent!
    Developpement pour Android avec Python3/Kivy/Buildozer

  7. #7
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Salut,

    Citation Envoyé par deubelte Voir le message
    @wiztricks,Sve@r:
    oui, cest une idée de splitter les chaines en sous chaines, mais je suis plus confiant avec les regex.
    Comment être "confiant" avec des difficultés à faire fonctionner l'exemple qu'on vous a donné?
    Choisissez une solution que vous pouvez maîtriser plutôt qu'un hypothétique mieux avec lequel vous allez patauger.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  8. #8
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 689
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 689
    Points : 30 983
    Points
    30 983
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par deubelte Voir le message
    Sve@r:
    oui, cest une idée de splitter les chaines en sous chaines, mais je suis plus confiant avec les regex.
    C'est comme si tu disais "oui je peux planter ce clou avec un marteau mais je suis plus confiant si j'utilise une presse hydraulique". Les outils ne sont efficaces que s'ils sont utilisés pour les bonnes raisons. Si ta chaine est bien carrée, alors (philosophie Python) simple is better than complex.

    Mais je comprends que tu puisses "craindre" que l'entrée ne soit pas tout le temps parfaite (surtout si elle vient de l'extérieur) et effectivement dans ce cas, la regex peut aider à calibrer le truc. Dans ce cas je pense que le pattern présenté par Hominidé ne prend pas en compte toutes les possibilités majuscules/minuscules. Moi je mettrais pattern = '(\w+) [sS][tT]'.
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  9. #9
    Membre expérimenté
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    870
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 870
    Points : 1 522
    Points
    1 522
    Billets dans le blog
    4
    Par défaut
    Citation Envoyé par Sve@r Voir le message
    Dans ce cas je pense que le pattern présenté par Hominidé ne prend pas en compte toutes les possibilités majuscules/minuscules. Moi je mettrais pattern = '(\w+) [sS][tT]'.
    Mon pattern prend bien en compte toutes les possibilités majuscules/minuscules... mais aussi peut révéler des faux positifs (genre avec s= " 999 G T Y 24st sT""" ou 'G' matchera). Donc +1 avec ta proposition
    #Rien de nouveau sous le soleil, tout est vanité comme courir après le vent!
    Developpement pour Android avec Python3/Kivy/Buildozer

  10. #10
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Salut,

    Citation Envoyé par Sve@r Voir le message
    Si ta chaine est bien carrée, alors (philosophie Python) simple is better than complex.

    Mais je comprends que tu puisses "craindre" que l'entrée ne soit pas tout le temps parfaite (surtout si elle vient de l'extérieur)
    Dans ce cas, on valide que la chaine de caractères est une adresse bien construite avant d'en extraire un des champs.

    Ce qui veut dire rejeter "201 W 21st St #9EF, New York" car le #9EF n'a rien à faire là.

    Pour faire çà, les expressions régulières peuvent être utiles pour valider l'ensemble (ou des bouts) de la chaîne de caractères.

    Utiles pas parce que ce sera mieux ou plus performant mais parce qu'il sera plus facile d'écrire le code correspondant (moins de lignes = plus facile à relire et à y chercher une erreur au cas où).

    Après bien sûr on peut utiliser des regexp pour "survendre" la vérification/test qu'on n'a pas fait.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  11. #11
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 689
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 689
    Points : 30 983
    Points
    30 983
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par Hominidé Voir le message
    Mon pattern prend bien en compte toutes les possibilités majuscules/minuscules...
    Hé non, "[ST|st]" ne prend en compte que "ST" ou "st", mais ni "St" ni "sT". Ce n'est pas "toutes" les possibilités. Le pattern "[sS][tT]" lui demande une lettre à choisir entre "s" ou "S" puis une autre entre "t" ou "T" ce qui englobe là toute la plage des 4 possibles. Ensuite est-ce une bonne chose (par rapport au faux positif) ça c'est un autre débat.
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  12. #12
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 776
    Points
    36 776
    Par défaut
    Salut,

    Citation Envoyé par Hominidé Voir le message
    Mon pattern prend bien en compte toutes les possibilités majuscules/minuscules...
    Essayez avec pattern = '(\w+) ([ST|St])', vous aurez d'autres surprises.
    Il faudrait écrire '(\w+) (ST|St)' pour matcher St ou ST.
    Ceci dit pour ignorer la casse on peut écrire: re.findall('(\w+) ST', s, re.I).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  13. #13
    Membre expérimenté
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    870
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 870
    Points : 1 522
    Points
    1 522
    Billets dans le blog
    4
    Par défaut
    Citation Envoyé par wiztricks Voir le message
    Ceci dit pour ignorer la casse on peut écrire: re.findall('(\w+) ST', s, re.I).

    - W
    Merci, je n'y pense jamais

    Pour ceux qui découvrent, autre approche possible :
    #Rien de nouveau sous le soleil, tout est vanité comme courir après le vent!
    Developpement pour Android avec Python3/Kivy/Buildozer

  14. #14
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 689
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 689
    Points : 30 983
    Points
    30 983
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par Hominidé Voir le message
    Merci, je n'y pense jamais
    Moi non plus

    Citation Envoyé par Hominidé Voir le message
    Pour ceux qui découvrent, autre approche possible : pattern = '\w+ (?=St)'
    Euh... ouais, je découvre et je pige que quick.
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  15. #15
    Membre expérimenté
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    870
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 870
    Points : 1 522
    Points
    1 522
    Billets dans le blog
    4
    Par défaut
    Citation Envoyé par Sve@r Voir le message
    Moi non plus


    Euh... ouais, je découvre et je pige que quick.
    ... Et pour ceux qui utilise un shell, cette expression est supportée par grep -P
    #Rien de nouveau sous le soleil, tout est vanité comme courir après le vent!
    Developpement pour Android avec Python3/Kivy/Buildozer

Discussions similaires

  1. RegEx et Python
    Par benoxy dans le forum Général Python
    Réponses: 7
    Dernier message: 20/09/2011, 20h05
  2. [Python] Regex d'intro
    Par nicolo011 dans le forum Général Python
    Réponses: 4
    Dernier message: 26/01/2010, 14h30
  3. Regex en python
    Par greg1517 dans le forum Général Python
    Réponses: 5
    Dernier message: 12/10/2009, 15h55
  4. regex : différence entre Perl et Python
    Par rambc dans le forum Général Python
    Réponses: 3
    Dernier message: 08/01/2009, 20h53
  5. python et regex
    Par olaxius dans le forum Général Python
    Réponses: 2
    Dernier message: 15/11/2006, 14h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo