IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Extract Phone Number


Sujet :

Python

  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2010
    Messages
    573
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 573
    Par défaut Extract Phone Number
    Salut le Forum,

    Je cherche un petit coup de main pour extraire un numéro de telephone d'une chaine de caractère
    J'ai trouvé des choses dans mes recherches mais étant une vraie bille en regex, je suis perdue ....
    Voici le code
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
     
    import re
    Source = """<p><strong>Kuala Lumpur</strong><strong>:</strong> 06 12 16 2712 </p>"""
     
    def extract_mobile_number(text):
    	phone = re.findall(re.compile(r'(?:(?:\+?([1-9]|[0-9][0-9]|[0-9][0-9][0-9])\s*(?:[.-]\s*)?)?(?:\(\s*([2-9]1[02-9]|[2-9][02-8]1|[2-9][02-8][02-9])\s*\)|([0-9][1-9]|[0-9]1[02-9]|[2-9][02-8]1|[2-9][02-8][02-9]))\s*(?:[.-]\s*)?)?([2-9]1[02-9]|[2-9][02-9]1|[2-9][02-9]{2})\s*(?:[.-]\s*)?([0-9]{4})(?:\s*(?:#|x\.?|ext\.?|extension)\s*(\d+))?'), text)
    	print(phone)
    	if phone:
    		number = ''.join(phone[0])
    		if len(number) > 10:
    			return '+' + number
    		else:
    			return number
     
    print(extract_mobile_number(Source))
    Si vous avez une idée
    Merci d'avance

    Thais

  2. #2
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut
    Une petite requête sur ton moteur favori avec "regex python téléphone" te donnera qqchose de bcp plus simple...

  3. #3
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2010
    Messages
    573
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 573
    Par défaut
    Merci, c'est effectivement ce que j'avais fais ...
    Mais mon appel a l'aide vient peut être pas d'un pb de regex ??
    Meme quand j'essaye plusieurs combinaisons, j'ai toujours une chaine vide en retour

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
     
    import re
    Source = "<p><strong>Kuala Lumpur</strong><strong>:</strong> 0612162712 "
     
    def extract_mobile_number(text):
    	expression = r"^0[0-9]([ .-]?[0-9]{2}){4}$"
    	phone = re.findall(re.compile(expression), text)
    	print(phone)
    	if phone:
    		number = ''.join(phone[0])
    		if len(number) > 10:
    			return '+' + number
    		else:
    			return number
    print(extract_mobile_number(Source))
     
     
     
    print(re.search(r"^0[0-9]([ .-]?[0-9]{2}){4}$", Source))
     
     
     
    chn_mdp = r"^0[0-9]([ .-]?[0-9]{2}){4}$"
    exp_mdp = re.compile(chn_mdp)
    print(exp_mdp.search(Source))
    Helppppppp

  4. #4
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 736
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 736
    Par défaut
    Salut,

    Citation Envoyé par thais781 Voir le message
    Mais mon appel a l'aide vient peut être pas d'un pb de regex ??
    Meme quand j'essaye plusieurs combinaisons, j'ai toujours une chaine vide en retour
    Une regex, c'est comme du code. Ca s'écrit parce qu'on espère avoir compris comment décrire le pattern à attraper et si çà ne fonctionne pas, çà se relit pour comprendre pourquoi çà ne fonctionne pas et l'améliorer.
    Donc si la chaine de caractères est "<p><strong>Kuala Lumpur</strong><strong>:</strong> 0612162712 "
    et qu'on cherche à attraper une suite de digits, on écrira:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    >>> s = "<p><strong>Kuala Lumpur</strong><strong>:</strong> 0612162712 "
    >>> import re
    >>> re.findall('[\d]+', s)
    ['0612162712']
    Et si c'est autre chose on adapte...

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2010
    Messages
    573
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 573
    Par défaut
    Merci pour vos conseils, je suis vraiment une bille en regex
    Je ne comprend pas ce qui peut clocher dans cette expression ...
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    	expression = r"^0[0-9]([ .-]?[0-9]{2}){4}$"
    ^0 : commence par un 0
    [0-9] : le chiffre 2 est entre 0 et 9
    ([ .-]?[0-9]{2}) : on a soit un espace, un point, un tiret ou rien suivi de 2 chiffres entre 0 et 9
    {4} : on repète cette parenthèse 4 fois

    donc une chaine "pur</strong><strong>:</strong> 0612 16-27.12"
    devrait être détecté et extraite .... mais non ....

    Thais

  6. #6
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 736
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 736
    Par défaut
    Salut,

    Citation Envoyé par thais781 Voir le message
    Merci pour vos conseils, je suis vraiment une bille en regex
    Déjà je ne comprends pas pourquoi vous n'utilisez pas un BS4 pour parser le HTML:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    "<p><strong>Kuala Lumpur</strong><strong>:</strong> 06 12 16 2712 </p>"
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    >>>  html = ...
    >>> soup = bs4.BeautifulSoup(html, "html.parser")
    >>> soup.text
    'Kuala Lumpur: 06 12 16 2712 '
    >>>
    facile à découper en 2 suivant les ':'.


    Après si vous voulez progresser côté regex, ben, il y a plein de tutos. et il va falloir y passer du temps pour être moins "bille".

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  7. #7
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    chn_mdp = r"([0]{1})([1-9]{1})[ .,/-]?[1-9]{2}[ .,/-]?[1-9]{2}[ .,/-]?[1-9]{2}[ .,/-]?[1-9]{2}"
    exp_mdp = re.compile(chn_mdp)
    print(exp_mdp.search(Source))

  8. #8
    Membre Expert
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    920
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 920
    Billets dans le blog
    8
    Par défaut
    Bonsoir,
    Je suis aussi une bille en regex.
    Cependant si ça peut t'aider:
    Citation Envoyé par thais781
    ^0 : commence par un 0
    Pas vraiment. La chaine en question commence par p
    s = 'pur</strong><strong>:</strong> 0612 16-27.12'
    ....
    Voici avec ma bille^^ ce que je ferais:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    re.findall('[0][0-9]+[ .-][0-9]+[ .-][0-9]+[ .-][0-9]+',s)
    [0] car ton tel commence par 0
    [0-9]+ va te matcher 612
    [ .-][0-9]+ va te matcher un espace ou un point ou - suivit d'un ou plusieurs chiffres

  9. #9
    Membre éclairé
    Profil pro
    Inscrit en
    Février 2010
    Messages
    573
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 573
    Par défaut
    Bon après un peu de formation sur les Regex suivant vos conseils, voici ma version finale :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
    import re
    Source = "0033bonjour 01 12.16-2712 toto +336 12.23-0033 titi 0033 6 12.56-2712"
     
    MyEndResult = []
    for MyResult in re.findall('(?:0033|\+33|0)[-.\s]?[1-9]{1}[-.\s]?\d{2}[-.\s]?\d{2}[-.\s]?\d{2}[-.\s]?\d{2}', Source):
    	MyTemp = MyResult.replace(".","").replace(" ","").replace("-","").replace("+33","0")
    	MyTemp = re.sub('^%s' % "0033", "0", MyTemp)
    	MyEndResult.append(MyTemp)
     
    print(MyEndResult)
     
    >>>  ['0112162712', '0612230033', '0612562712']
    Si ca peut être utile a qqun ;-)
    Par contre s'il y a des cas que ca ne gère pas, n'hésitez pas ....

    Dans tous les cas, merci pour votre aide et vos conseils

    Thais

  10. #10
    Membre Expert
    Avatar de Hephaistos007
    Profil pro
    Enseignant Chercheur
    Inscrit en
    Décembre 2004
    Messages
    2 493
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2004
    Messages : 2 493
    Par défaut
    Pas très "clean code" tout ca. Pourquoi ne pas exploiter ce que t'offre Python, comme suit :

    Code python : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
    #sous-programmes (facilement modifiables si besoin)
    def extractPhonesFromText(txt): return re.findall('(?:0033|\+33|0)[-.\s]?[1-9]{1}[-.\s]?\d{2}[-.\s]?\d{2}[-.\s]?\d{2}[-.\s]?\d{2}', txt)
     
    def sanitizePhone(phoneNumber): return re.sub('^%s' % "0033", "0", phoneNumber.replace(".","").replace(" ","").replace("-","").replace("+33","0"))
     
    #programme principal
    import re
    Source = "0033bonjour 01 12.16-2712 toto +336 12.23-0033 titi 0033 6 12.56-2712"
     
    allPhones = extractPhonesFromText(Source)
    allSanitizedPhones = list(map(sanitizePhone, allPhones))
    print(allSanitizedPhones)
    Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes --- devise SHADOKS

    Kit de survie Android : mon guide pour apprendre à programmer sur Android, mon tutoriel sur les web services et enfin l'outil en ligne pour vous faire gagner du temps - N'oubliez pas de consulter la FAQ Android

Discussions similaires

  1. Réponses: 0
    Dernier message: 25/05/2019, 10h52
  2. Récupérer Adresse Mail, Phone Number via EWS
    Par blackhox dans le forum C#
    Réponses: 14
    Dernier message: 07/12/2013, 13h23
  3. what is phone number
    Par Damouille dans le forum Humour Informatique
    Réponses: 1
    Dernier message: 25/02/2011, 11h50

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo