1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
| def remove_rtf_tags(text):
# Expression régulière pour supprimer les balises RTF
clean_text = re.sub(r'{\\[^ ]+}|\\[^ ]+}|\\[^ ]+', '', text)
return clean_text.strip()
#=============================================================================
def cherche_parenthese_ouvrante_hameau_rtf(targetFile):
# détecte l'absence de parenthèse ouvrante dans toutes les occurrences d'une chaine.
# pattern = r'\b(?<!\()[A-Z]{1,4}\)'
# \b Détermine la position du début des lettres
# (?<!\() Assure qu'il n'y a pas de parenthèse ouvrante avant la position actuelle
# [A-Z]{1,4} Correspond à un mot en majuscule de 1 à 4 lettres
# \) Correspond à une parenthèse fermante
with open(targetFile, 'r', encoding='latin-1') as file:
rtf_content = file.readlines()
pattern = r'\b(?<!\()[A-Z]{1,4}\)'
for i, line in enumerate(rtf_content):
matches = re.finditer(pattern, line)
for match in matches:
print(f"ERREUR parenthèse : {line.strip()}")
clean_line = remove_rtf_tags(line.strip())
print(f"Ligne détectée : {clean_line}") |