IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

regex: extraire le troisième élément en partant de la fin d'une URL [Python 3.X]


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Février 2013
    Messages
    606
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Février 2013
    Messages : 606
    Par défaut regex: extraire le troisième élément en partant de la fin d'une URL
    Bonjour,

    Je voudrais savoir comment récupérer le troisième élément en partant de la fin dans une url:
    Par exemple:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    import re
    >>> url = "vfzefqzd/qzdqzdq/qdzqdqa/qdaqd/élement/fqefqqf/efqfq
    >>> pattern = ""
    >>> reg = re.search(pattern, next_page_url)
    >>> print(reg)
    >>> élement

  2. #2
    Membre prolifique
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 833
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 833
    Billets dans le blog
    1
    Par défaut
    Bonjour
    Citation Envoyé par pitchu Voir le message
    Je voudrais savoir comment récupérer le troisième élément en partant de la fin dans une url:
    reg=url.split("/")[-3]
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  3. #3
    Invité
    Invité(e)
    Par défaut
    Slt !
    Avec re :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    re.split(r'/', url)[-3]

  4. #4
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Février 2013
    Messages
    606
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Février 2013
    Messages : 606
    Par défaut
    merci de vos aides

  5. #5
    Membre Expert
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    923
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 923
    Billets dans le blog
    8
    Par défaut
    Bonjour,
    Citation Envoyé par pitchu Voir le message
    Bonjour,

    Je voudrais savoir comment récupérer le troisième élément en partant de la fin dans une url:
    Par exemple:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    import re
    >>> url = "vfzefqzd/qzdqzdq/qdzqdqa/qdaqd/élement/fqefqqf/efqfq
    >>> pattern = ""
    >>> reg = re.search(pattern, next_page_url)
    >>> print(reg)
    >>> élement
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    >>> url = "vfzefqzd/qzdqzdq/qdzqdqa/qdaqd/élement/fqefqqf/efqfq"
    >>> pat = r"(\w*)/\w*/\w*$"
    >>> reg = re.search(pat, url)
    >>> reg.group(1)
    'élement'
    >>>

  6. #6
    Expert confirmé
    Avatar de jurassic pork
    Homme Profil pro
    Bidouilleur
    Inscrit en
    Décembre 2008
    Messages
    4 219
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Bidouilleur
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2008
    Messages : 4 219
    Par défaut
    Hello,
    il est à noter que quand cela est possible (comme dans le cas présent) un split chaîne est plus écologique (moins de consommation CPU) que l'utilisation des expressions régulières. Voici un test de performance avec les 3 méthodes proposées précédemment :


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    import re
    from time import perf_counter_ns
    url = "vfzefqzd/qzdqzdq/qdzqdqa/qdaqd/élement/fqefqqf/efqfq"
    pat = r"(\w*)/\w*/\w*$"
    start = perf_counter_ns()
    reg=url.split("/")[-3]
    stop = perf_counter_ns()
    print(reg)
    print("temps écoulé pour url.split : " + str(stop-start) + " ns")
    print("=========================================")
    start = perf_counter_ns()
    re.split(r'/', url)[-3]
    stop = perf_counter_ns()
    print(reg)
    print("temps écoulé pour re.split : " + str(stop-start) + " ns")
    print("=========================================")
    start =  perf_counter_ns()
    reg = re.search(pat, url)
    stop =  perf_counter_ns()
    print(reg.group(1))
    print("temps écoulé pour re.search : " + str(stop-start) + " ns")
    Résultat :
    élement
    temps écoulé pour url.split : 1400 ns
    =========================================
    élement
    temps écoulé pour re.split : 84900 ns
    =========================================
    élement
    temps écoulé pour re.search : 104800 ns



    Ami calmant, J.P

  7. #7
    Membre Expert
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    923
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 923
    Billets dans le blog
    8
    Par défaut
    Bonjour,

    à noter aussi qu'avec une expression rationnelle, si l'expression est amenée à être utilisée plusieurs fois, il est préférable en termes de vitesse d'exécution d'utiliser re.compile().

  8. #8
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 741
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 741
    Par défaut
    Citation Envoyé par Hominidé Voir le message
    Bonjour,

    à noter aussi qu'avec une expression rationnelle, si l'expression est amenée à être utilisée plusieurs fois, il est préférable en termes de vitesse d'exécution d'utiliser re.compile().
    C'est plus compliqué que çà (source):
    The compiled versions of the most recent patterns passed to re.compile() and the module-level matching functions are cached, so programs that use only a few regular expressions at a time needn’t worry about compiling regular expressions.
    Citation Envoyé par jurassic pork Voir le message
    il est à noter que quand cela est possible (comme dans le cas présent) un split chaîne est plus écologique (moins de consommation CPU) que l'utilisation des expressions régulières.
    Ce qui est logique car traiter une expression régulière nécessite la mise en place et l'exécution d'un automate dont les complexités seront indépendantes de l'expression: simple ou complexe, c'est parti pour faire le même boulot.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  9. #9
    Membre Expert
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    923
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 923
    Billets dans le blog
    8
    Par défaut
    Citation Envoyé par wiztricks Voir le message
    C'est plus compliqué que çà (source):

    - W
    J'en comprends ce que j'en ai dit, mais peut être j'interprète mal ce que je lis
    D'ailleurs après test,
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    import re
    from time import perf_counter_ns
    url = "vfzefqzd/qzdqzdq/qdzqdqa/qdaqd/élement/fqefqqf/efqfq"
    pat = r"(\w*)/\w*/\w*$"
     
    start =  perf_counter_ns()
    reg = re.search(pat, url)
    stop =  perf_counter_ns()
    print(reg.group(1))
    print(f"temps écoulé pour re.search :                     {stop-start} ns")
     
    start =  perf_counter_ns()
    pat = re.compile(pat)
    reg = pat.search(url)
    stop =  perf_counter_ns()
    print(f"temps écoulé pour re.compile/re.search :          {stop-start} ns")
     
    start =  perf_counter_ns()
    pat = re.compile(pat)
    for _ in range(1000):
        reg = pat.search(url)
    stop =  perf_counter_ns()
    print(f"temps écoulé pour re.search/re.compile; loop:1000:{stop-start} ns")
    il semble profitable de compiler l'expression rationnelle même pour une seule utilisation (7.8 plus rapide). Utilisée dans une boucle de 1000 loops, l'exécution de re.search() devient 20 fois plus rapide. Je m'attendais, à la lecture de la doc de Re, qu'utiliser re.compile() pour une seule utilisation de l'expression n'était pas utile/encouragé...

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Extraire la fin d'une url en javascript
    Par Invité dans le forum Général JavaScript
    Réponses: 5
    Dernier message: 13/07/2015, 08h24
  2. Réponses: 3
    Dernier message: 03/04/2008, 15h29
  3. Réunir un textarea, un input text et un troisième élément
    Par Pragmateek dans le forum Mise en page CSS
    Réponses: 5
    Dernier message: 06/03/2008, 21h01
  4. [RegEx] Regex : extraire les urls des tags [img]
    Par Thi0123 dans le forum Langage
    Réponses: 4
    Dernier message: 18/10/2006, 14h00
  5. Extraire le 2eme élément à partir d'un file xml.
    Par rootdaoud dans le forum XML/XSL et SOAP
    Réponses: 2
    Dernier message: 17/05/2006, 17h39

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo