IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Modules Perl Discussion :

XML::Twig pasre att -> valeur


Sujet :

Modules Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    infographiste
    Inscrit en
    Avril 2012
    Messages
    41
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : infographiste
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Avril 2012
    Messages : 41
    Par défaut XML::Twig pasre att -> valeur
    Bonjour,

    Je voudrais récupéré des élément d'un fichier XML base sur une valeur d'attribut ex: "<w:footnote w:id="1">" avec XML::Twig, j'ai traduis la doc et je ne suis pas parvenu à tous comprandre!

    je suppose que je dois parser le document avec (att -> 'w:id"$valeur"');

    Mon but, est de récupéré les notes que j'ai besoin au fur et à mesure du traitement pour ne pas utilisé de la mémoire (je peux avoir de quelques notes jusqu'à 4000 notes!).

    Merci d'avance pour un début de piste ou d'exemple à voir.

    Code xml : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    <w:footnote w:id="1">
    	<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
    		<w:r>
    			<w:rPr>
    				<w:rStyle w:val="Caractresdenotedebasdepage"/>
    			</w:rPr>
    			<w:footnoteRef/>
    		</w:r>
    		<w:r>
    			<w:tab/>
    			<w:t>Test</w:t>
    		</w:r>
    	</w:p>
    </w:footnote>
    <w:footnote w:id="2">
    	<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
    		<w:r>
    			<w:rPr>
    				<w:rStyle w:val="Caractresdenotedebasdepage"/>
    			</w:rPr>
    			<w:footnoteRef/>
    		</w:r>
    		<w:r>
    			<w:tab/>
    			<w:t>Test</w:t>
    		</w:r>
    	</w:p>
    </w:footnote>
    <w:footnote w:id="3">
    	<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
    		<w:r>
    			<w:rPr>
    				<w:rStyle w:val="Caractresdenotedebasdepage"/>
    			</w:rPr>
    			<w:footnoteRef/>
    		</w:r>
    		<w:r>
    			<w:tab/>
    			<w:t>Test</w:t>
    		</w:r>
    	</w:p>
    </w:footnote>

  2. #2
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    Peux-tu nous montrer ton code et je t'aiderai.
    Tu peux utiliser les twig_handler du module pour faire du chunk by chunk pour éviter de charger tout en mémoire.

  3. #3
    Membre averti
    Homme Profil pro
    infographiste
    Inscrit en
    Avril 2012
    Messages
    41
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : infographiste
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Avril 2012
    Messages : 41
    Par défaut twig_handlers et les attribus
    Bonjour et merci de m'avoir indiqué là où je devais chercher,

    Voici mon code, je parvient à atteindre l'attribue "1", si je veux seulement deuxième j'ai un problème, j'ai aussi toujours un message d'erreur :
    "junk after document element at line 15, column 0, byte 264 at /usr/local/ActivePerl-5.14/lib/XML/Parser.pm line 187 at Test05_OKFinal.pl line 11"

    Ps: désolé mais ce n'est pas un manque de respect si le texte n'est pas toujours bien écrit ou correctement orthographier, je suis dyslexique, j'utilise les correcteur mais ce n'est pas toujours génial, et pour traduire l'anglais, j'utilise Google. (c'est pas gagné)

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    #!/usr/bin/perl -w
    use strict;
    use warnings;
    use XML::Twig;
     
    my $laNotesApple = "1"; 
     
    my $t = XML::Twig->new( twig_handlers => { 'w:footnote[@w:id="'. $laNotesApple .'"]' => \&laNotes } );
    $t -> parse( \*DATA);
    #----------------------------
    # Funstion
    sub laNotes {
        my ($twig, $element) = @_;
            print $element->text() . " Philou";
            $twig->purge;
    }
     
    __DATA__
    <w:footnote w:id="1">
    	<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
    		<w:r>
    			<w:rPr>
    				<w:rStyle w:val="Caractresdenotedebasdepage"/>
    			</w:rPr>
    			<w:footnoteRef/>
    		</w:r>
    		<w:r>
    			<w:tab/>
    			<w:t>Test Notes 01</w:t>
    		</w:r>
    	</w:p>
    </w:footnote>
    <w:footnote w:id="2">
    	<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
    		<w:r>
    			<w:rPr>
    				<w:rStyle w:val="Caractresdenotedebasdepage"/>
    			</w:rPr>
    			<w:footnoteRef/>
    		</w:r>
    		<w:r>
    			<w:tab/>
    			<w:t>Test Notes 02</w:t>
    		</w:r>
    	</w:p>
    </w:footnote>
    <w:footnote w:id="3">
    	<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
    		<w:r>
    			<w:rPr>
    				<w:rStyle w:val="Caractresdenotedebasdepage"/>
    			</w:rPr>
    			<w:footnoteRef/>
    		</w:r>
    		<w:r>
    			<w:tab/>
    			<w:t>Test Notes 03</w:t>
    		</w:r>
    	</w:p>
    </w:footnote>

  4. #4
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    Votre fichier XML n'était pas valide. Il faut une entête et une balise mère.

    Voici le code refait pour vous
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    #!/usr/bin/perl
    use Carp;
    use strict;
    use warnings;
    use XML::Twig;
     
    my $t = XML::Twig->new( 
      twig_handlers => { 
        'w:footnote' => \&laNotes, 
      } 
    );
    $t->parsefile('test.xml');
     
    #----------------------------
    # Funstion
    sub laNotes {
        my ($twig, $twig_element) = @_;
     
        my $note = $twig_element->att('w:id');
        print "Note : $note\n";
    }
    Et le fichier test.xml
    Code xml : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    <?xml version="1.0" encoding="utf-8"?>
    <BALISEMERE>
      <w:footnote w:id="1">
      	<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
      		<w:r>
      			<w:rPr>
      				<w:rStyle w:val="Caractresdenotedebasdepage"/>
      			</w:rPr>
      			<w:footnoteRef/>
      		</w:r>
      		<w:r>
      			<w:tab/>
      			<w:t>Test Notes 01</w:t>
      		</w:r>
      	</w:p>
      </w:footnote>
      <w:footnote w:id="2">
      	<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
      		<w:r>
      			<w:rPr>
      				<w:rStyle w:val="Caractresdenotedebasdepage"/>
      			</w:rPr>
      			<w:footnoteRef/>
      		</w:r>
      		<w:r>
      			<w:tab/>
      			<w:t>Test Notes 02</w:t>
      		</w:r>
      	</w:p>
      </w:footnote>
      <w:footnote w:id="3">
      	<w:p w:rsidR="00E076E2" w:rsidRDefault="00E076E2">
      		<w:r>
      			<w:rPr>
      				<w:rStyle w:val="Caractresdenotedebasdepage"/>
      			</w:rPr>
      			<w:footnoteRef/>
      		</w:r>
      		<w:r>
      			<w:tab/>
      			<w:t>Test Notes 03</w:t>
      		</w:r>
      	</w:p>
      </w:footnote>
    </BALISEMERE>

    Résultat :
    Note : 1
    Note : 2
    Note : 3

  5. #5
    Membre averti
    Homme Profil pro
    infographiste
    Inscrit en
    Avril 2012
    Messages
    41
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : infographiste
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Avril 2012
    Messages : 41
    Par défaut XML::Twig pasre att -> valeur
    Merci djibril,

    Votre solution fonctionne, petit question, il fait donc appel autant de fois à la fonction qu'il y a de notes trouvé.

    Dans mon cas je converti un docx en fichier texte référencer pour Indesign, je traite le texte et quand j'arrive à la première note, deux solution:

    — je traite toutes les notes que je stock en mémoire dans un tableau de hachage ou dans un autre fichier temporaire;

    — je recherche chaque note et la traite quand j'en ai besoin.

    Un fichier temporaire ne me semble pas la meilleur solution en sachant que je pare déjà d'un fichier (footnotes.xml), le tableau de hachage est déjà un peux mieux mais quand je dois géré 4080 notes avec assez bien de textes j'ai peur pour la mémoire.

    Donc ma commande fonction avec le fichier XML corrigé
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    twig_handlers => { 'w:footnote[@w:id="'. $laNotesApple .'"]'
    (Merci), elle me semblai plus adéquate mais là aussi il va y avoir des accès disque important!!! non?

    Si ma réflexion est bonne, quel est là meilleur solution, je cherche à être le plus économe possible!

  6. #6
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    Va falloir être un peu clair et donner des exemples car je ne comprends pas ce que vous faites.

    La méthode twighandler permet juste de ne pas mettre en mémoire tous le fichier XML, juste les sections.

    Maintenant, vous me parlez de fichiers temporaires, texte, docx... On s'y perd un peu.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. problème "require" XML::Twig.
    Par Dimension_N dans le forum Modules
    Réponses: 5
    Dernier message: 27/02/2009, 02h33
  2. [XML]comment acceder a une valeur avec XmlDocument
    Par shirya dans le forum VB.NET
    Réponses: 4
    Dernier message: 12/05/2008, 19h10
  3. [XML::Twig] Commentaires dans le fichier XML réécrit
    Par knarf87 dans le forum Modules
    Réponses: 2
    Dernier message: 07/05/2008, 09h24
  4. [SimpleXML] Parser un XML et en récupérer des valeurs
    Par mickael.be dans le forum Bibliothèques et frameworks
    Réponses: 6
    Dernier message: 15/04/2006, 15h08
  5. [Ant]Lire un XML - renvoyer un tableau de valeurs
    Par gael.poffet dans le forum Format d'échange (XML, JSON...)
    Réponses: 1
    Dernier message: 06/03/2006, 15h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo