IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Travailler sur un array d'un gros flux XML


Sujet :

Langage PHP

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé Avatar de Mika2008
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 176
    Par défaut Travailler sur un array d'un gros flux XML
    Bonjour,

    j'ai un fichier XML de 100 Mo, et j’aimerais le travailler en php,

    j'ai trouver cette classe :

    http://www.phpclasses.org/package/46...-PHP-code.html

    Et donc cette classe à l'air de bien fonctionner mais je me retrouve avec un array des données du flux XML, et je ne sais pas comment les traiter,

    voici ce que me donne : la variable parser :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Array ( [doc] => Array ( [0] => Array ( [item1] => Array ( [0] => Array ( [@data] => value of item1 [@attributes] => Array ( [atr1] => asdf [atr2] => asdddd ) ) ) [item2] => Array ( [0] => Array ( [@data] => item2 value ) [1] => Array ( [@data] => whatever ) ) [item3] => Array ( [0] => Array ( [hm] => Array ( [0] => Array ( [@data] => some text [@attributes] => Array ( [atr1] => what? ) ) ) ) ) [@attributes] => Array ( [atr1] => value ) ) ) )

    est ce quelqu'un peut me donner juste un petit aide pour pouvoir utiliser les données enregistré dans cette aray ?

    par exemple si je veux enregistrer la variable de la balise item2 dans une variable, ou juste l'afficher comment je dois faire svp ?


    merci beaucoup

  2. #2
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Par défaut
    Un début de piste
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    foreach ($flux['doc'][0]['item2'] as $contenu) {
          foreach ($contenu as $values) {
              echo '<p>' . $values . '</p>';
          }
    }
    N'oubliez pas de consulter les FAQ PHP et les cours et tutoriels PHP

  3. #3
    Membre confirmé Avatar de Mika2008
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 176
    Par défaut
    Bonjour,

    merci de votre réponse :

    voila flux de test que j'utilise :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    <?xml version="1.0" encoding="iso-8859-2" ?>
    <doc atr1="value">
    	<item1 atr1="asdf" atr2="asdddd">value of item1</item1>
    	<item2>item2 value</item2>
    	<item2>whatever</item2>
    	<item3>
    		<hm>S1 some text1</hm>
    		<hm>S1 some text2</hm>
    		<hm>S1 some text3</hm>
    		<hm>S1 some text4</hm>
    	</item3>
     
    	<item3>
    		<hm>S2 some text1</hm>
    		<hm>S2 some text2</hm>
    		<hm>S2 some text3</hm>
    		<hm>S2 some text4</hm>
    	</item3>
    </doc>

    et donc lorsque j'utilise le code suivant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    foreach ($flux['doc'][0]['item3'][0]['hm'] as $contenu) {
          foreach ($contenu as $values) {
              echo '<p>' . $values . '</p>';
          }
    }
    j'ai le résultat suivant :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    S1 some text1
     
    S1 some text2
     
    S1 some text3
     
    S1 some text4

    ça ne m'affiche pas tout les résultat concernant la balise item3 il me manque les lignes suivantes :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    <hm>S2 some text1</hm>
    		<hm>S2 some text2</hm>
    		<hm>S2 some text3</hm>
    		<hm>S2 some text4</hm>
    j'ai compris qu'en modifiant le code comme ceci il ne m'afficheras que la S2, mais plus les S1 :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    foreach ($flux['doc'][0]['item3'][1]['hm'] as $contenu) {
          foreach ($contenu as $values) {
              echo '<p>' . $values . '</p>';
          }
    }

    du coup je ne comprend pas comment afficher tout les résultat des balise hm directement sans écrire tout le chemin de la balise, car je ne trouve pas ça très pratique.

    avant de trouver cette classe php, j'avais écrit du code en utilisant que Dom :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
     
    <?php
    // relever le point de départ
    $timestart=microtime(true);
     
     
    $nomFic = "sample.xml"; 
      $dom = new DomDocument;
      $dom->load($nomFic);
      $listeFichierPdf = $dom->getElementsByTagName('hm');
     
    $cpt_fic_pdf =  0;
     
    foreach($listeFichierPdf as $fichierPdf){
      	echo $fichierPdf->firstChild->nodeValue . "<br />"; // affiche la valeur de la balise
     
    	$cpt_fic_pdf = $cpt_fic_pdf +1; 
      }
     
    echo "<br />---<br />";
    echo "nbr de um = $cpt_fic_pdf";
    echo "<br />---<br />";
    ?>
     
    <?php
    //Fin du code PHP
    $timeend=microtime(true);
    $time=$timeend-$timestart;
     
    //Afficher le temps de chargement
    $page_load_time = number_format($time, 3);
    echo "Debut du chargement: ".date("H:i:s", $timestart);
    echo "<br>Fin de reception: ".date("H:i:s", $timeend);
    echo "<br>Page chargee en " . $page_load_time . " sec";
    ?>
    du coup avec ce code j'ai le résultat suivant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    S1 some text1
    S1 some text2
    S1 some text3
    S1 some text4
    S2 some text1
    S2 some text2
    S2 some text3
    S2 some text4
     
    ---
    nbr de um = 8
    ---
    Debut du chargement: 10:54:38
    Fin de reception: 10:54:38
    Page chargee en 0.001 sec

    du coup mon objectif et de comprendre comment utilisé cette classe PHP, pour ensuite comparer le tps de réponse entre mon programme et l'utilisation de la classe

    qu'en pensez vous svp ?

    merci d'avance

  4. #4
    Expert confirmé
    Avatar de rawsrc
    Homme Profil pro
    Dev indep
    Inscrit en
    Mars 2004
    Messages
    6 142
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Dev indep

    Informations forums :
    Inscription : Mars 2004
    Messages : 6 142
    Billets dans le blog
    12
    Par défaut
    Salut,

    la doc de ta classe indique ceci :
    This class parses XML documents using pure PHP code, thus without XML parser extensions.

    It reads a XML document file and parses it to extract the structure of tags and data values into a nested array.
    Un point important : pour parser du XML c'est DOMDocument et sûrement pas des couches de regex comme le fait ta classe.
    D'ailleurs si tu dépieutes la page de description, l'auteur l'a lui-même appelée : slow_xml_parser !

    C'est de la bidouille qui peut servir/dépanner quand tu travailles sur environnement exotique mais il ne faut surtout pas utiliser cette approche en production qui plus est dans un environnement PHP 5.x+.

    Au final, je peux te garantir que DOMDocument sera bien plus rapide que les regex.

  5. #5
    Membre confirmé Avatar de Mika2008
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 176
    Par défaut
    Merci de ta réponse

  6. #6
    Modérateur
    Avatar de grunk
    Homme Profil pro
    Lead dév - Architecte
    Inscrit en
    Août 2003
    Messages
    6 693
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Lead dév - Architecte
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2003
    Messages : 6 693
    Par défaut
    Pour parser des gros XML il vaut mieux utiliser SAX qui à l'avantage d'avoir une faible empreinte mémoire comparer à DOM.

    C'est un peu moins intuitif à utiliser mais la DOC est plutôt complète à ce sujet : http://php.net/manual/en/book.xml.php

    Un extrait de livre sur le sujet : http://docstore.mik.ua/orelly/webprog/pcook/ch12_05.htm
    Pry Framework php5 | N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

Discussions similaires

  1. [Débutant] Creation un flux de travail sur 2 formulaire
    Par nguyen denis dans le forum SharePoint
    Réponses: 7
    Dernier message: 18/06/2015, 14h56
  2. Gros flux XML généré par une servlet
    Par aurelientp dans le forum Servlets/JSP
    Réponses: 1
    Dernier message: 16/07/2009, 22h59
  3. Travailler sur des données qui doivent être triées
    Par haypo dans le forum XML/XSL et SOAP
    Réponses: 2
    Dernier message: 19/07/2003, 17h13

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo