Bonjour à tous !
Je ne sais pas si je suis au bon endroit pour poser ma question. Cependant, je ne vois pas d'autre endroit où je pourrais la poser...
Voilà, je dois réaliser une macro sous OpenOffice.org-Writer qui a pour but de me permettre de réaliser le parsage d'un fichier HTML en un fichier XML à l'aide d'un fichier XSL.
Actuellement, j'ai un tableau dans un fichier "*.doc". A l'aide d'OpenOffice.org, j'arrive à convertir ce tableau en HTML et le résultat est bien plus propre et mieux construit que le code récupéré à l'aide de Microsoft Word... Cependant, il reste des attributs dont la valeur n'est pas entre guillement. Or ceci rend impossible d'utiliser un processeur XSL pour réaliser le parsage dont j'ai besoin.
Pour illustrer mon propos :
J'ai
Et je voudrais avoir :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 <BALISE1 attr1="a" attr2=xyz attr3=plop> ... </BALISE1> <BALISE2 attr4=ijk attr5="123"/>
Ou :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 <BALISE1> ... </BALISE1> <BALISE2/>
Il existerait donc deux solutions :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 <BALISE1 attr1="a" attr2="xyz" attr3="plop"> ... </BALISE1> <BALISE2 attr4="ijk" attr5="123"/>
1. supprimer tous les attributs (seul le nom des balises m'intéressent)
2. rajouter les guillemets nécessaires
Je viens de débuter en Basic de OOo et j'ai donc de nombreux soucis... Cependant, j'envisageais d'utiliser, dans les deux cas, d'éléments invoqués de cette manière :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 vOpenSearch=ThisComponent.createSearchDescriptor()
L'algorithme que j'avais envisagé pour la 1. est :
L'algorithme pour la 2. est :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14 - Effacer tous les guillemets déjà installés - TANT QUE nous n'arrivons pas à la fin du texte - SI je trouve "<" ALORS - SI je trouve ">" ALORS * (entre les deux [i]SearchDescriptor[/i]) - SI je trouve "=" ALORS remplacer par " =" " - SI je trouve " " ALORS - SI je trouve "/>" ALORS remplacer par ""/>" - SI je trouve ">" ALORS remplacer par "">" - FIN SI - FIN SI - FIN SI - FIN TANT QUE
Est-ce que vous pourriez me donner des conseils ? Quelle méthode vous parait la plus propre ? La plus simple à mettre en oeuvre ? Ou bien... si vous avez une autre suggestion...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 - TANT QUE nous n'arrivons pas à la fin du texte - SI je trouve "<" ALORS - SI je trouve ">" ALORS - SI je trouve " " ALORS supprimer jusqu'à "/" OU jusqu'à ">" - FIN SI - FIN SI - FIN TANT QUE
En fait, j'arrive actuellement à trouver les "<" et ">". Le problème vient du fait que je ne sais pas effectuer les traitements en utilisant les positions des curseurs que j'utilise (les SearchDescriptor). Si je savais faire celà, je pense que je pourrais dire : entre ces deux positions, efface tout (en s'ayant décalé auparavent...)
J'espère que vous avez compris mon problème et que vous pourrez m'aider !
Partager