Extract Phone Number

**thais781** · 01/03/2020, 19h52

Salut le Forum,

Je cherche un petit coup de main pour extraire un numéro de telephone d'une chaine de caractère
J'ai trouvé des choses dans mes recherches mais étant une vraie bille en regex, je suis perdue ....
Voici le code

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
 
import re
Source = """<p><strong>Kuala Lumpur</strong><strong>:</strong> 06 12 16 2712 </p>"""
 
def extract_mobile_number(text):
	phone = re.findall(re.compile(r'(?:(?:\+?([1-9]|[0-9][0-9]|[0-9][0-9][0-9])\s*(?:[.-]\s*)?)?(?:\(\s*([2-9]1[02-9]|[2-9][02-8]1|[2-9][02-8][02-9])\s*\)|([0-9][1-9]|[0-9]1[02-9]|[2-9][02-8]1|[2-9][02-8][02-9]))\s*(?:[.-]\s*)?)?([2-9]1[02-9]|[2-9][02-9]1|[2-9][02-9]{2})\s*(?:[.-]\s*)?([0-9]{4})(?:\s*(?:#|x\.?|ext\.?|extension)\s*(\d+))?'), text)
	print(phone)
	if phone:
		number = ''.join(phone[0])
		if len(number) > 10:
			return '+' + number
		else:
			return number
 
print(extract_mobile_number(Source))

Si vous avez une idée

Merci d'avance

Thais

**marco056** · 01/03/2020, 21h44

Une petite requête sur ton moteur favori avec "regex python téléphone" te donnera qqchose de bcp plus simple...

**thais781** · 02/03/2020, 16h08

Merci, c'est effectivement ce que j'avais fais ...
Mais mon appel a l'aide vient peut être pas d'un pb de regex ??
Meme quand j'essaye plusieurs combinaisons, j'ai toujours une chaine vide en retour

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
 
import re
Source = "<p><strong>Kuala Lumpur</strong><strong>:</strong> 0612162712 "
 
def extract_mobile_number(text):
	expression = r"^0[0-9]([ .-]?[0-9]{2}){4}$"
	phone = re.findall(re.compile(expression), text)
	print(phone)
	if phone:
		number = ''.join(phone[0])
		if len(number) > 10:
			return '+' + number
		else:
			return number
print(extract_mobile_number(Source))
 
 
 
print(re.search(r"^0[0-9]([ .-]?[0-9]{2}){4}$", Source))
 
 
 
chn_mdp = r"^0[0-9]([ .-]?[0-9]{2}){4}$"
exp_mdp = re.compile(chn_mdp)
print(exp_mdp.search(Source))

Helppppppp

**wiztricks** · 02/03/2020, 16h30

Salut,

Envoyé par thais781

Mais mon appel a l'aide vient peut être pas d'un pb de regex ??
Meme quand j'essaye plusieurs combinaisons, j'ai toujours une chaine vide en retour

Une regex, c'est comme du code. Ca s'écrit parce qu'on espère avoir compris comment décrire le pattern à attraper et si çà ne fonctionne pas, çà se relit pour comprendre pourquoi çà ne fonctionne pas et l'améliorer.
Donc si la chaine de caractères est "Kuala Lumpur: 0612162712 "
et qu'on cherche à attraper une suite de digits, on écrira:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
>>> s = "<p><strong>Kuala Lumpur</strong><strong>:</strong> 0612162712 "
>>> import re
>>> re.findall('[\d]+', s)
['0612162712']

Et si c'est autre chose on adapte...

- W

**thais781** · 02/03/2020, 18h33

Merci pour vos conseils, je suis vraiment une bille en regex
Je ne comprend pas ce qui peut clocher dans cette expression ...

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
 
	expression = r"^0[0-9]([ .-]?[0-9]{2}){4}$"

^0 : commence par un 0
[0-9] : le chiffre 2 est entre 0 et 9
([ .-]?[0-9]{2}) : on a soit un espace, un point, un tiret ou rien suivi de 2 chiffres entre 0 et 9
{4} : on repète cette parenthèse 4 fois

donc une chaine "pur: 0612 16-27.12"
devrait être détecté et extraite .... mais non ....

Thais

**wiztricks** · 02/03/2020, 19h46

Salut,

Envoyé par thais781

Merci pour vos conseils, je suis vraiment une bille en regex

Déjà je ne comprends pas pourquoi vous n'utilisez pas un BS4 pour parser le HTML:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

"<p><strong>Kuala Lumpur</strong><strong>:</strong> 06 12 16 2712 </p>"

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
>>>  html = ...
>>> soup = bs4.BeautifulSoup(html, "html.parser")
>>> soup.text
'Kuala Lumpur: 06 12 16 2712 '
>>>

facile à découper en 2 suivant les ':'.

Après si vous voulez progresser côté regex, ben, il y a plein de tutos. et il va falloir y passer du temps pour être moins "bille".

- W

Extract Phone Number

Python

Vue hybride

Discussions similaires

Partager

Partager