Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
 
import re
 
with open("extract.txt", "r", ) as fic:
    for test_str in fic:
        r1 = re.findall(r"[D]\d+[.| ]{0,1}\d+[.| ]{0,1}\d+", test_str)
        if len(r1) == 1:
            print (r1)
Bonsoir
je cherche a extraire des séquences de caractères écrites sous cette forme
idéalement c'est ca:
D12312345123 (1lettre, 3+5+3 chiffres)


mais le texte peut aussi contenir des choses écrites différemment comme
D123-12345.123
d123.12345123
D123 12345 123
ou des choses incorrectes, incomplètes
D12-12345.123

Comment écririez vous le pattern regex, pour tout détecter ?