Bonjour,

Je dois coder un programme capable de nettoyer des caractère spéciaux dans un fichier texte.

Il se trouve que ce dernier est un fichier XML (donc balises).

J'utilise la classe regex. Mais par exemple, le <, > ou même le guillemet sont des caractères interdits que mon robot nettoiera alors que ces balises XML ne doivent pas être prises en compte pour le nettoyage.

Comment puis-je écarter les balises xml de ma regex ?

Je ne sais pas si c'est possible mais mon idée était de déclarer dans ma regex des chaines autorisés (comme <document>). Est-ce possible ? Et si c'est possible, cela voudra bien dire que <document> est autorisé mais un caractère "seule" comme > ou < autre part sera nettoyé ?



Voici mon code
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
 
Dim maRegex As Regex
        maRegex = New Regex("[^a-zA-Z0-9*/?:()-.,'+\f\n\r\t\v]") 'je vais remplacer tous les caractères interdits saufs ceux ci (^)
 
 
'
'mon code
'
 
nouvelleChaine = maRegex.Replace(nouvelleChaine, " ")

Merci de votre aide.