Bonjour,
(pardon si je poste pas dans le bon forum mais j'ai pas trouvé de catégorie prog tout cours en python j'ai vu prog scientifique et vu que ça traite d'un probleme de science...)
Voila je bloque sur un parsing depuis quelques temps.
exemple :
"""zertrevsd é&"'(13'"é'><>>>sr"ér "tzf [Bos Taurus]rezrezr zerezrezcsefves erezr [Candidas Albicans]<\>
ere [Homo sapiens] &&&& [Homo sapiens sapiens]
"""
Je souhaite récupérer les éléments entre crochets :
Avec ce pattern le résultat n'est pas toujours bon :
re.compile(".*?\[(\w+\s+\w+)\W+.+\].*?")
ou
re.compile(".*?\[(\w+\s+\w+)\].*?")
Le probleme c'est que je ne sais pas combien de mot il peut y avoir entre parenthése ... par exemple pour le dernier 3 mots du coup le pattern ne marche plus car je peux avoir [aa ggg] ou [aa ggg hhhh] ou [a ere ere fdre vdfrdg]
Je pense avoir essayer une bonne centaine de solution mais ne trouve pas un pattern robuste qui récupère toutes les solutions
Je vous remercie pour votre attention et votre aide.
Mister
Partager