XML::Twig pasre att -> valeur
Bonjour,
Je voudrais récupéré des élément d'un fichier XML base sur une valeur d'attribut ex: "<w:footnote w:id="1">" avec XML::Twig, j'ai traduis la doc et je ne suis pas parvenu à tous comprandre!
je suppose que je dois parser le document avec (att -> 'w:id"$valeur"');
Mon but, est de récupéré les notes que j'ai besoin au fur et à mesure du traitement pour ne pas utilisé de la mémoire (je peux avoir de quelques notes jusqu'à 4000 notes!).
Merci d'avance pour un début de piste ou d'exemple à voir.
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
| <w:footnote w:id="1">
<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
<w:r>
<w:rPr>
<w:rStyle w:val="Caractresdenotedebasdepage"/>
</w:rPr>
<w:footnoteRef/>
</w:r>
<w:r>
<w:tab/>
<w:t>Test</w:t>
</w:r>
</w:p>
</w:footnote>
<w:footnote w:id="2">
<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
<w:r>
<w:rPr>
<w:rStyle w:val="Caractresdenotedebasdepage"/>
</w:rPr>
<w:footnoteRef/>
</w:r>
<w:r>
<w:tab/>
<w:t>Test</w:t>
</w:r>
</w:p>
</w:footnote>
<w:footnote w:id="3">
<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
<w:r>
<w:rPr>
<w:rStyle w:val="Caractresdenotedebasdepage"/>
</w:rPr>
<w:footnoteRef/>
</w:r>
<w:r>
<w:tab/>
<w:t>Test</w:t>
</w:r>
</w:p>
</w:footnote> |
twig_handlers et les attribus
Bonjour et merci de m'avoir indiqué là où je devais chercher,
Voici mon code, je parvient à atteindre l'attribue "1", si je veux seulement deuxième j'ai un problème, j'ai aussi toujours un message d'erreur :
"junk after document element at line 15, column 0, byte 264 at /usr/local/ActivePerl-5.14/lib/XML/Parser.pm line 187 at Test05_OKFinal.pl line 11"
Ps: désolé mais ce n'est pas un manque de respect si le texte n'est pas toujours bien écrit ou correctement orthographier, je suis dyslexique, j'utilise les correcteur mais ce n'est pas toujours génial, et pour traduire l'anglais, j'utilise Google. (c'est pas gagné)
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
| #!/usr/bin/perl -w
use strict;
use warnings;
use XML::Twig;
my $laNotesApple = "1";
my $t = XML::Twig->new( twig_handlers => { 'w:footnote[@w:id="'. $laNotesApple .'"]' => \&laNotes } );
$t -> parse( \*DATA);
#----------------------------
# Funstion
sub laNotes {
my ($twig, $element) = @_;
print $element->text() . " Philou";
$twig->purge;
}
__DATA__
<w:footnote w:id="1">
<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
<w:r>
<w:rPr>
<w:rStyle w:val="Caractresdenotedebasdepage"/>
</w:rPr>
<w:footnoteRef/>
</w:r>
<w:r>
<w:tab/>
<w:t>Test Notes 01</w:t>
</w:r>
</w:p>
</w:footnote>
<w:footnote w:id="2">
<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
<w:r>
<w:rPr>
<w:rStyle w:val="Caractresdenotedebasdepage"/>
</w:rPr>
<w:footnoteRef/>
</w:r>
<w:r>
<w:tab/>
<w:t>Test Notes 02</w:t>
</w:r>
</w:p>
</w:footnote>
<w:footnote w:id="3">
<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
<w:r>
<w:rPr>
<w:rStyle w:val="Caractresdenotedebasdepage"/>
</w:rPr>
<w:footnoteRef/>
</w:r>
<w:r>
<w:tab/>
<w:t>Test Notes 03</w:t>
</w:r>
</w:p>
</w:footnote> |
XML::Twig pasre att -> valeur
Merci djibril,
Votre solution fonctionne, petit question, il fait donc appel autant de fois à la fonction qu'il y a de notes trouvé.
Dans mon cas je converti un docx en fichier texte référencer pour Indesign, je traite le texte et quand j'arrive à la première note, deux solution:
— je traite toutes les notes que je stock en mémoire dans un tableau de hachage ou dans un autre fichier temporaire;
— je recherche chaque note et la traite quand j'en ai besoin.
Un fichier temporaire ne me semble pas la meilleur solution en sachant que je pare déjà d'un fichier (footnotes.xml), le tableau de hachage est déjà un peux mieux mais quand je dois géré 4080 notes avec assez bien de textes j'ai peur pour la mémoire.
Donc ma commande fonction avec le fichier XML corrigé
Code:
twig_handlers => { 'w:footnote[@w:id="'. $laNotesApple .'"]'
(Merci), elle me semblai plus adéquate mais là aussi il va y avoir des accès disque important!!! non?
Si ma réflexion est bonne, quel est là meilleur solution, je cherche à être le plus économe possible!