Bonjour à tous,
Mes données:
Des PDF numériques
Mon objectif:
Créer des Pattern Regex pour sélectionner les éléments dont j'ai besoin dans les PDF (cela fonctionne déjà bien)
Mon problème:
Je voudrais savoir si je peux introduire une condition dans un pattern. Voici par exemple mon problème: j'ai de temps en temps du contenu qui, à cause de sa longueur, fait un retour à la ligne alors que la majorité du temps ça n'est pas le cas. Ce cas se produit s'il s'agit d'un produit unitaire et donc avec la phrase "votre commande à une valeur de". Est-il possible de ne faire qu'un seul pattern au lieu de deux ?
Du coup, mon pattern (sans retour à la ligne) est de type :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 pattern_pieces['retour']= '(?P<Quantite>\d+) ('vos commandes pour un montant de|vos commandes sont') . ' \ '(?P<Montant>\d*[.]?\d+[,]\d{2})\\n' \
Mais, si j'ai un retour à la ligne alors mon pattern serait plutôt:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4 pattern_pieces['retour']= '(?P<Quantite>\d+) ("votre commande à une valeur de") .\\n ' \ #je dois ici ajouter un saut de ligne '(?P<Montant>\d*[.]?\d+[,]\d{2})\\n' \
Merci à vous,
Partager