IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Extract Phone Number


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2010
    Messages
    573
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 573
    Par défaut Extract Phone Number
    Salut le Forum,

    Je cherche un petit coup de main pour extraire un numéro de telephone d'une chaine de caractère
    J'ai trouvé des choses dans mes recherches mais étant une vraie bille en regex, je suis perdue ....
    Voici le code
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
     
    import re
    Source = """<p><strong>Kuala Lumpur</strong><strong>:</strong> 06 12 16 2712 </p>"""
     
    def extract_mobile_number(text):
    	phone = re.findall(re.compile(r'(?:(?:\+?([1-9]|[0-9][0-9]|[0-9][0-9][0-9])\s*(?:[.-]\s*)?)?(?:\(\s*([2-9]1[02-9]|[2-9][02-8]1|[2-9][02-8][02-9])\s*\)|([0-9][1-9]|[0-9]1[02-9]|[2-9][02-8]1|[2-9][02-8][02-9]))\s*(?:[.-]\s*)?)?([2-9]1[02-9]|[2-9][02-9]1|[2-9][02-9]{2})\s*(?:[.-]\s*)?([0-9]{4})(?:\s*(?:#|x\.?|ext\.?|extension)\s*(\d+))?'), text)
    	print(phone)
    	if phone:
    		number = ''.join(phone[0])
    		if len(number) > 10:
    			return '+' + number
    		else:
    			return number
     
    print(extract_mobile_number(Source))
    Si vous avez une idée
    Merci d'avance

    Thais

  2. #2
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut
    Une petite requête sur ton moteur favori avec "regex python téléphone" te donnera qqchose de bcp plus simple...

  3. #3
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2010
    Messages
    573
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 573
    Par défaut
    Merci, c'est effectivement ce que j'avais fais ...
    Mais mon appel a l'aide vient peut être pas d'un pb de regex ??
    Meme quand j'essaye plusieurs combinaisons, j'ai toujours une chaine vide en retour

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
     
    import re
    Source = "<p><strong>Kuala Lumpur</strong><strong>:</strong> 0612162712 "
     
    def extract_mobile_number(text):
    	expression = r"^0[0-9]([ .-]?[0-9]{2}){4}$"
    	phone = re.findall(re.compile(expression), text)
    	print(phone)
    	if phone:
    		number = ''.join(phone[0])
    		if len(number) > 10:
    			return '+' + number
    		else:
    			return number
    print(extract_mobile_number(Source))
     
     
     
    print(re.search(r"^0[0-9]([ .-]?[0-9]{2}){4}$", Source))
     
     
     
    chn_mdp = r"^0[0-9]([ .-]?[0-9]{2}){4}$"
    exp_mdp = re.compile(chn_mdp)
    print(exp_mdp.search(Source))
    Helppppppp

  4. #4
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 741
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 741
    Par défaut
    Salut,

    Citation Envoyé par thais781 Voir le message
    Mais mon appel a l'aide vient peut être pas d'un pb de regex ??
    Meme quand j'essaye plusieurs combinaisons, j'ai toujours une chaine vide en retour
    Une regex, c'est comme du code. Ca s'écrit parce qu'on espère avoir compris comment décrire le pattern à attraper et si çà ne fonctionne pas, çà se relit pour comprendre pourquoi çà ne fonctionne pas et l'améliorer.
    Donc si la chaine de caractères est "<p><strong>Kuala Lumpur</strong><strong>:</strong> 0612162712 "
    et qu'on cherche à attraper une suite de digits, on écrira:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    >>> s = "<p><strong>Kuala Lumpur</strong><strong>:</strong> 0612162712 "
    >>> import re
    >>> re.findall('[\d]+', s)
    ['0612162712']
    Et si c'est autre chose on adapte...

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2010
    Messages
    573
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 573
    Par défaut
    Merci pour vos conseils, je suis vraiment une bille en regex
    Je ne comprend pas ce qui peut clocher dans cette expression ...
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    	expression = r"^0[0-9]([ .-]?[0-9]{2}){4}$"
    ^0 : commence par un 0
    [0-9] : le chiffre 2 est entre 0 et 9
    ([ .-]?[0-9]{2}) : on a soit un espace, un point, un tiret ou rien suivi de 2 chiffres entre 0 et 9
    {4} : on repète cette parenthèse 4 fois

    donc une chaine "pur</strong><strong>:</strong> 0612 16-27.12"
    devrait être détecté et extraite .... mais non ....

    Thais

  6. #6
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 741
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 741
    Par défaut
    Salut,

    Citation Envoyé par thais781 Voir le message
    Merci pour vos conseils, je suis vraiment une bille en regex
    Déjà je ne comprends pas pourquoi vous n'utilisez pas un BS4 pour parser le HTML:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    "<p><strong>Kuala Lumpur</strong><strong>:</strong> 06 12 16 2712 </p>"
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    >>>  html = ...
    >>> soup = bs4.BeautifulSoup(html, "html.parser")
    >>> soup.text
    'Kuala Lumpur: 06 12 16 2712 '
    >>>
    facile à découper en 2 suivant les ':'.


    Après si vous voulez progresser côté regex, ben, il y a plein de tutos. et il va falloir y passer du temps pour être moins "bille".

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

Discussions similaires

  1. Réponses: 0
    Dernier message: 25/05/2019, 10h52
  2. Récupérer Adresse Mail, Phone Number via EWS
    Par blackhox dans le forum C#
    Réponses: 14
    Dernier message: 07/12/2013, 13h23
  3. what is phone number
    Par Damouille dans le forum Humour Informatique
    Réponses: 1
    Dernier message: 25/02/2011, 11h50

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo