IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Modules Perl Discussion :

Utilisation d'une table de hachage - Transformation XML avec Twig


Sujet :

Modules Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par défaut [résolu] Utilisation d'une table de hachage - Transformation XML avec Twig
    Bonjour,

    Je travaille sur des ressources lexicales codées en XML. L'objectif est de transformer ces ressources en un même balisage XML (pour les fusionner ensuite).

    Pour cela, j'ai un programme pour chaque ressource (ils fonctionnent tous). Mais je me suis demandé s'il n'était pas possible de programmer une sorte de "Transformation universelle" puisque le résultat doit être le même.

    J'ai donc pensé établir une table de hachage au début de mon programme. Les clefs sont les balises que l'on aura en sortie, les valeurs les balises de la source.

    Cependant, le résultat est quelque peu problématique, d'où ce sujet.

    -- PROLOGUE : --

    FAQ sur les hash tables
    Introduction à la programmation en Perl de S. Lhullier
    Divers sujets déjà créés, dont celui-ci (problème valeurs/clefs)

    Pas de solution trouvée.


    -- SOURCE (extrait d'une des sources à traiter) : source_test.xml --

    Code xml : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
     
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <!-- ?xml:stylesheet type="text/css" href="fravie.css"? -->
    <!-- DOCTYPE dictionary SYSTEM "fravie.dtd" -->
    <volume name="ThuyDict_fra" source-language="fra" target-language="vie" creation-date="18/01/2002">
    <entry id=""><headword>a</headword>
    <syntactic-sense><pos>xxx</pos>
    <translation lang="vie">xxx</translation>
    <example><fra>a majuscule (A)</fra><vie>xxx</vie></example>
    <example><fra>a minuscule (a)</fra><vie>xxx</vie></example>
    </syntactic-sense>
    <syntactic-sense><pos>xxx</pos>
    <translation lang="vie">xxx</translation>
    <translation lang="vie">xxx</translation>
    <translation lang="vie">xxx</translation>
    <translation lang="vie">xxx</translation>
    </syntactic-sense>
    <syntactic-sense><pos>xxx</pos>
    <translation lang="vie">xxx</translation>
    </syntactic-sense>
    </entry>
    <entry id=""><headword>abaca</headword>
    <syntactic-sense><pos>xxx</pos>
    <translation lang="vie">xxx</translation>
    </syntactic-sense>
    </entry>
    </volume>

    les 'xxx' sont en réalité des termes en vietnamiens (mais l'affichage pose problème sur le forum).

    -- CODE (j'ai supprimé le superflu - gestion des arguments de la commande - et simplifié au maximum pour plus de clarté) : TRANSFO.pl --
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
     
    #!/usr/bin/perl
    #
    ###------###
    #
    use strict;
    use warnings;
    use locale;
    use utf8;
    use XML::Twig; 
    use XML::Twig::Xpath;
    #
    ###------###
    # [1] Table de hachage
    #
    my %balises = (   "entry"         => "entry",
                            "head"          => "",
    		        "headword"      => "headword",
    		        "pronunciation" => "",
    		        "pos"           => "syntactic-sense",
    		        "sense"         => "",
    		        "definition"    => "",
    		        "label"         => "",
    	   	        "formula"       => "",
    	  	        "gloss"         => "",
    		        "translations"  => "",
    		        "translation"   => "translation",
    		        "examples"      => "",
    		        "example"       => "example/vie",
    		        "idioms"        => "",
    		        "idiom"         => "",
                            "else"          => "example/fra", );
    #
    # [2] Autres variables :
    #
    my ($FichierXML,    # le fichier source
      $FichierResultat, # le fichier en sortie
      $FiRe,            # descripteur pour le fichier en sortie
      $erreur,          # message d'erreur
      $encoding,        # format d'encodage par défaut 
      $twig,            # variable pour le parsing
      $CountEntry,      # comptage des entrées
      $TwigEntry,       # le twig pour la balise <entry>
      $date) = 0;    # la date
    #
    ##------##
    #
    $erreur = "|ERROR| : problem opening the file :"; 
    $encoding = "UTF-8"; 
    $date = localtime;
    $CountEntry = 0;
    #
    ##------##
    # Input
    $FichierXML = 'source_test.xml';
    # Output
    $FichierResultat = 'out_test.xml';
    open ($FiRe, ">:encoding($encoding)",$FichierResultat)
      or die ("$erreur $!\n");
    #
    #
    print {$FiRe} 
    "<?xml version=\"1.0\" encoding=\"UTF-8\" standalone=\"yes\"?>\n", 
    "<m:volume name=\"VD_Mam\" creation-date=\"$date\">\n";
    #
    ###------###
    #
    #
    $twig = new XML::Twig (Twig_handlers => {'entry' => \&entry,},);
    $twig -> parsefile($FichierXML);
    #
    print {$FiRe} "</m:volume>";
    close($FiRe);
    #
    ###------###
    #
    sub entry 
    {
    ($twig, $TwigEntry) = @_;
    $CountEntry++;
    #
    my $path_headword = $TwigEntry->get_xpath($balises{'headword'});
    print {$FiRe} "<m:entry", ' ', 'id="fra.', $path_headword,'">';
    print {$FiRe} "<m:head>";
    print {$FiRe} "<m:headword>", $path_headword, "</m:headword>";
    print {$FiRe} "<m:pronunciation></m:pronunciation>";
    print {$FiRe} "<m:pos>", "</m:pos>"; 
    print {$FiRe} "</m:head>";
    print {$FiRe} "</m:entry>", "\n";
    #
    $twig->purge;
    return;
    }
    ##------##
    1 ;
    J'ai choisi pour l'exemple de ne travailler que sur <headword>, je suppose que si une solution est trouvée pour cette élément, je pourrais l'appliquer au reste. J'utilise les pointeurs xpath, la seul possibilité pour une transformation commune aux sources selon moi.

    -- RÉSULTAT (de l'extrait indiqué) out_test.xml --
    Code xml : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <m:volume name="VD_Mam" creation-date="Sat May 29 12:07:57 2010">
    <m:entry id="fra.1"><m:head><m:headword>1</m:headword><m:pronunciation></m:pronunciation><m:pos></m:pos></m:head></m:entry>
    <m:entry id="fra.1"><m:head><m:headword>1</m:headword><m:pronunciation></m:pronunciation><m:pos></m:pos></m:head></m:entry>
    </m:volume>

    Ainsi donc au lieu d'afficher le PCDATA de l'élément <headword>, je me retrouve avec un 1 (sûrement pour me dire TRUE non ?!). J'en suis arrivé là.


    -- CONCLUSION --


    Si vous avez connu ce genre de problème, ou encore si vous avez un avis sur le programme en général, merci de me répondre !

    Bon weekend à tous (même si vous ne me répondez pas )

  2. #2
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 59
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Par défaut
    La méthode get_xpath retourne une liste d'éléments. Affecter le retour de cette fonction à un scalaire fourni un contexte de scalaire à l'affectation, qui converti alors automatiquement la liste en sa taille. Dans ton cas, il y a 1 élément qui correspond au path.

    Pour récupérer le premier élément de cette liste, il faut écrire l'affectation dans un contexte de liste, ainsi :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my ($path_headword) = $TwigEntry->get_xpath($balises{'headword'});

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par défaut
    Merci beaucoup pour ta réponse Philou67430.

    Je ne connaissais pas ce point de détail, qui va grandement accélérer mes p'tits programmes !!

    Je teste, je l'applique au "vrai" programme (au cas où).

    Dois-je inscrire le nouveau code ensuite ? Pour aider les petites gens comme moi .

  4. #4
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par défaut
    Je viens de tester, j'ai toujours le même problème. Tu avais fait un test de ton côté ? On sait jamais, l'erreur est peut être ailleurs.

    Sinon tu m'as donné une idée, et j'ai trouvé une solution en remplaçant par :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my ($path_headword) = $TwigEntry->first_child($balises{headword})->text;
    Mais malheureusement, en mettant ça je ne traiterai que le premier fils, comment passer aux suivants ? Il va falloir que j'y réfléchisse, je pense que c'est faisable sans grosse difficulté (enfin j'espère).

    Merci du coup de main, qui m'a quand même permis d'avancer.

  5. #5
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 59
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Par défaut
    Non, je n'ai pas testé, car je n'ai pas d'exemple complet à tester, et je ne connais pas ces modules.
    J'ai simplement constaté que la méthode get_xpath retournait une liste, et que par conséquent, pour récupérer une liste et non la taille de cette liste, il faut l'affecter à une autre liste.

    Quand tu dis que tu as toujours le même problème, tu veux dire que tu vois "1" au lieu de ce que tu attends dans $path_headword ?

  6. #6
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    Voici ton fichier XML indenté :
    Code xml : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <!-- ?xml:stylesheet type="text/css" href="fravie.css"? -->
    <!-- DOCTYPE dictionary SYSTEM "fravie.dtd" -->
    <volume creation-date="18/01/2002" name="ThuyDict_fra" source-language="fra" target-language="vie">
      <entry id="">
        <headword>a</headword>
        <syntactic-sense>
          <pos>xxx</pos>
          <translation lang="vie">xxx</translation>
          <example>
            <fra>a majuscule (A)</fra>
            <vie>xxx</vie>
          </example>
          <example>
            <fra>a minuscule (a)</fra>
            <vie>xxx</vie>
          </example>
        </syntactic-sense>
        <syntactic-sense>
          <pos>xxx</pos>
          <translation lang="vie">xxx</translation>
          <translation lang="vie">xxx</translation>
          <translation lang="vie">xxx</translation>
          <translation lang="vie">xxx</translation>
        </syntactic-sense>
        <syntactic-sense>
          <pos>xxx</pos>
          <translation lang="vie">xxx</translation>
        </syntactic-sense>
      </entry>
      <entry id="">
        <headword>abaca</headword>
        <syntactic-sense>
          <pos>xxx</pos>
          <translation lang="vie">xxx</translation>
        </syntactic-sense>
      </entry>
    </volume>

    Peux tu expliquer de novo ce que tu souhaites en sortie. Je n'ai pas compris l'histoire des balises headword.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 6
    Dernier message: 08/08/2018, 12h49
  2. Réponses: 2
    Dernier message: 19/06/2008, 16h46
  3. Réponses: 2
    Dernier message: 21/06/2006, 09h23
  4. recherche utilisation d'une table
    Par xmanu dans le forum Access
    Réponses: 2
    Dernier message: 21/09/2005, 09h09

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo