récupérer les mots en gras d'un text

**GUSGUIG** · 04/07/2022, 14h33

Bonjour je souhaite simplement récuper et extraire les mot en gras d'un text grace à un scripte python ;
Je suis completement débutant alors j'avoue que je ne sais même pas comment à partir d'un text en gras (ici sur one note) l'extraire dans un script python qui comprendrai ce qui est gras de ce qui ne l'es pas.

**Arioch** · 04/07/2022, 14h46

Bonjour,

vous risquez vite de vous retrouver avec deux choix possibles :

- soit faire appel à un dev Python qui vous concoctera un programme pour lequel il y ait des chances qu'une rétribution financière soit demandée.
- soit vous ouvrez un tuto pour apprendre Python.

Je crois que personne ici ne vous livrera un code tout fait bien fait. Pas le genre de la maison.

Invité · 04/07/2022, 16h08

Salut !

Je ne suis pas le genre de la maison du coup j'aurai bien essayé mais ça dépasse mon niveau... Je vais tout de même jeter un oeil mais je doute que ça suffise !

PS : Ca sera sans moi, trop compliqué, je connais rien aux API...

**wiztricks** · 04/07/2022, 16h48

Salut,

onenote dispose d'une API ReST, sous-ensemble du protocole HTTP (et donc de la programmation réseau)...
Cette API est documentée.
Donc techniquement, on peut... écrire une application Python qui interagit avec.

Reste à se cogner la documentation voire à chercher des exemples de code sur Internet (car on est rarement le premier a vouloir faire ce genre de chose et l'expérience des autres est toujours instructive...)... chose qu'on ne fera pas pour vous.
Mais peut être qu'un des lecteurs de cette discussion voudra bien partager son expérience avec vous... reste à attendre qu'il se manifeste.

- W

**jurassic pork** · 04/07/2022, 17h00

Hello,

Envoyé par GUSGUIG

Bonjour je souhaite simplement récuper et extraire les mot en gras d'un text grace à un scripte python ;
Je suis completement débutant alors j'avoue que je ne sais même pas comment à partir d'un text en gras (ici sur one note) l'extraire dans un script python qui comprendrai ce qui est gras de ce qui ne l'es pas.

OneNote n'est pas l'idéal pour faire ce genre d'exploitation. Un traitement de texte comme word ou writer serait plus facile à exploiter. Par exemple dans writer, il y a une recherche de texte par attribut (ex: gras).
Ami calmant, J.P

**GUSGUIG** · 07/07/2022, 15h39

Hello tout le monde !

Merci beaucoup pour vos réponses !

J'ai trouvé comment extraire des mots ayant les balise en gras

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

<b></b>

Voici donc mon code :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
 
#recuperer les données en gras
text = []
Les_mots_en_gras = []
 
with open("file.txt", "r") as tf:
    text = tf.read().split(' ')
 
for boldword in text:
    if "</b>" in boldword:
        Les_mots_en_gras.append(boldword)
 
for boldword in Les_mots_en_gras:
    print(boldword)

ça fonctionne par exemple avec le txt suivant :

j'aime manger des patates très douces

ça me sort bien :
patates
douces

Je suis déjà content de ça !
mais le problème c'est que je ne trouve pas d'éditeur de texte qui puisse simplement marquer ces balise lorsqu'on l'ouvre en txt

**wiztricks** · 07/07/2022, 16h06

Envoyé par GUSGUIG

mais le problème c'est que je ne trouve pas d'éditeur de texte qui puisse simplement marquer ces balise lorsqu'on l'ouvre en txt

... sont à priori des balises HTML.
Un éditeur de texte qui sache faire apparaître du "gras" lorsqu'il voit des mots entre ces balises doit savoir interpréter/lire du HTML (comme un/votre navigateur Web par exemple).

Envoyé par GUSGUIG

Je suis déjà content de ça !

Dans les tutos, on vous propose des exercices parfois corrigés: si vous voulez apprendre à programmer il faut commencer par là... et avoir une idée des technologies de base à connaître pour avoir une idée de comment coder pour en profiter.

- W

**GUSGUIG** · 07/07/2022, 16h42

Bon c'est pas completement abouti et clairement c'est du bricolage mais j'ai déjà un truc qui fonctionne un peu prêt :

je copie/colle mon text dans Writer au format "HTML sans commentaire" que j'enregistre au format html (ici "Sans nom 1.html")

puis j'execute ce code :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
 
#recuperer les données en gras
text = []
Les_mots_en_gras = []
 
with open("Sans nom 1.html", "r") as tf:
    text = tf.read().split(' ')
 
for boldword in text:
    if "</b>" in boldword:
        Les_mots_en_gras.append(boldword)
 
for boldword in Les_mots_en_gras:
    print(boldword)

et ça me sort tout les mots en gras avec leurs balise :

donc par exemple si j'écris :

J’aime manger des patates très douces car c’est très bon

ça me sort bien :

manger
patates

Mais dès que le text est plus complexe ça ne fonctionne plus très bien car il faudrait que j'arrive à ouvrir la sélection avec la balise et la refermer avec la balise 
la je prend tous ce qui à la balise 
Peut être que qqn à une idée de comment faire ?

**wiztricks** · 07/07/2022, 18h04

Envoyé par GUSGUIG

Peut être que qqn à une idée de comment faire ?

Techniquement, on fait ça avec des expressions régulières ou on utilise une bibliothèque qui sait lire du HTML.

- W

Invité · 08/07/2022, 17h53

... ou BeautifulSoup

Sinon une méthode que j'affectionne et probablement plus rapide que les bibliothèques (pas tapé si je dis une connerie) si jamais tu cherches de la performance :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
>>> text = 'toto<b>GRAS</b>titi'
>>> [obj[obj.index('<b>')+3:] for obj in text.split('</b>')[:-1]]
['GRAS']

récupérer les mots en gras d'un text

Python

Vue hybride

Discussions similaires

Partager

Partager