[Regexp] splitter attribut tag xml
Bonjour,
Je viens vous demander conseil sur l'un de mes problèmes actuels : je voudrais splitter un tag xml pour faire ressortir ses attributs.
Voici l'exemple sur lequel je butte :
Code:
1 2
|
TOTO id="019053695" type="B" la=" " status="1" c="HG" date="20071120" |
Jusqu'à maintenant je splitter simplement par rapport au caractère 'space', ce qui me permettait effectivement de retrouver un tableau d'attribut (sans compter le premier indice du tableau qui est le nom du tag (TOTO))
Seulement dans le cas ici présent, lorsqu'un des attributs à pour valeur space (ce qui est possible dans mon document en entrée), ce split ne fonctionne plus et je me retrouve avec un élément dans mon tableau qui a pour valeur 'la="' au lieu de 'la="valeur"'.
J'aimerai donc savoir s'il est possible de mettre en place une regexp permettant de découper correctement ma chaine de caractère ?
J'ai tenté ceci :
Code:
1 2 3 4 5
|
// --- Create a pattern to match breaks
Pattern p = Pattern.compile("^([a-zA-Z_0-9]{1,}[=]\022.*\022)");
// Split input with the pattern
String[] result = p.split(myTagRepresentation); |
mais sans résultat probant :s
Je en sais pas trop comment m'y prendre, j'aurais voulu découper selon ce qui ne valide pas le modèle suivant : nomAttribut="valeur" puisque ça ne fonctionne pas avec les espaces.
Merci pour votre aide.