Pattern Regex avec condition
Bonjour à tous,
Mes données:
Des PDF numériques
Mon objectif:
Créer des Pattern Regex pour sélectionner les éléments dont j'ai besoin dans les PDF (cela fonctionne déjà bien)
Mon problème:
Je voudrais savoir si je peux introduire une condition dans un pattern. Voici par exemple mon problème: j'ai de temps en temps du contenu qui, à cause de sa longueur, fait un retour à la ligne alors que la majorité du temps ça n'est pas le cas. Ce cas se produit s'il s'agit d'un produit unitaire et donc avec la phrase "votre commande à une valeur de". Est-il possible de ne faire qu'un seul pattern au lieu de deux ?
Du coup, mon pattern (sans retour à la ligne) est de type :
Code:
1 2 3 4
|
pattern_pieces['retour']=
'(?P<Quantite>\d+) ('vos commandes pour un montant de|vos commandes sont') . ' \
'(?P<Montant>\d*[.]?\d+[,]\d{2})\\n' \ |
Mais, si j'ai un retour à la ligne alors mon pattern serait plutôt:
Code:
1 2 3 4
|
pattern_pieces['retour']=
'(?P<Quantite>\d+) ("votre commande à une valeur de") .\\n ' \ #je dois ici ajouter un saut de ligne
'(?P<Montant>\d*[.]?\d+[,]\d{2})\\n' \ |
Merci à vous,