Bonjour à tous,
J'aurais besoin de votre aide, je bosse sur un programme dont le but (pour simplifier) et de récupérer le texte d'une page Web et de récupérer la liste des mots existants dans le dictionnaire.
Je suis parvenu à récupérer ma liste de mots (avec BeautifulSoup) ( Ex: 'Lille', 'ville', 'du', 'Nord'). Ensuite pour vérifier l'existence dans le dictionnaire, je passe chaque mot en paramètre de l' url https://dictionnaire.lerobert.com/definition/.
En fonction du code HTTP 404 ou 200, j'en déduis l'existence ou non...
Et c'est là que les problème commence, ville est dans le dictionnaire, mais pas 'ville', du coup j'ai me suis penché sur les expressions régulières car c'est à mon avis la bonne piste,
Etant débutant Python, je ne m'en sort pas seul. Merci d'avance pour votre aide.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 i = 0 while i < len(liste_mots_potentiels) : transformation = re.sub(r"'.'",r".") liste_mots_potentiels[i] = str(re.sub(r"'.'",r".")) print("\n La liste de mots clés est : ",liste_mots_potentiels)
Partager