Bonjour à tous !
Je ne sais pas si je suis au bon endroit pour poser ma question. Cependant, je ne vois pas d'autre endroit où je pourrais la poser...
Voilà, je dois réaliser une macro sous Visual Basic Application pour Word qui a pour but de me permettre de réaliser le parsage d'un fichier HTML en un fichier XML à l'aide d'un fichier XSL.
Actuellement, j'ai un tableau dans un fichier "*.doc". A l'aide d'OpenOffice.org, j'arrive à convertir ce tableau en HTML et le résultat est bien plus propre et mieux construit que le code récupéré à l'aide de Microsoft Word... Cependant, il reste des attributs dont la valeur n'est pas entre guillement. Or ceci rend impossible d'utiliser un processeur XSL pour réaliser le parsage dont j'ai besoin.
Pour illustrer mon propos :
J'ai
Et je voudrais avoir :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 <BALISE1 attr1="a" attr2=xyz attr3=plop> ... </BALISE1> <BALISE2 attr4=ijk attr5="123"/>
Ou :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 <BALISE1> ... </BALISE1> <BALISE2/>
Il existerait donc deux solutions :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 <BALISE1 attr1="a" attr2="xyz" attr3="plop"> ... </BALISE1> <BALISE2 attr4="ijk" attr5="123"/>
1. supprimer tous les attributs (seul le nom des balises m'intéressent)
2. rajouter les guillemets nécessaires
Je ne connais pas trop le VBA pour Word et j'ai donc de nombreux soucis...
L'algorithme que j'avais envisagé pour la 1. est :
L'algorithme pour la 2. est :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14 - Effacer tous les guillemets déjà installés - TANT QUE nous n'arrivons pas à la fin du texte - SI je trouve "<" ALORS - SI je trouve ">" ALORS * (entre les deux éléments trouvés) - SI je trouve "=" ALORS remplacer par " =" " - SI je trouve " " ALORS - SI je trouve "/>" ALORS remplacer par ""/>" - SI je trouve ">" ALORS remplacer par "">" - FIN SI - FIN SI - FIN SI - FIN TANT QUE
Est-ce que vous pourriez me donner des conseils ? Quelle méthode vous parait la plus propre ? La plus simple à mettre en oeuvre ? Ou bien... si vous avez une autre suggestion...
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 - TANT QUE nous n'arrivons pas à la fin du texte - SI je trouve "<" ALORS - SI je trouve ">" ALORS - SI je trouve " " ALORS supprimer jusqu'à "/" OU jusqu'à ">" - FIN SI - FIN SI - FIN TANT QUE
J'espère que vous avez compris mon problème et que vous pourrez m'aider !
P.S. : La question est posée de la même manière pour effectuer le même traitement sous OpenOffice.org...
Partager