IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bibliothèques et frameworks PHP Discussion :

[XML] Fonction xml_set_character_data_handler et accent


Sujet :

Bibliothèques et frameworks PHP

  1. #1
    Membre actif
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    818
    Détails du profil
    Informations personnelles :
    Âge : 39
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2005
    Messages : 818
    Points : 288
    Points
    288
    Par défaut [XML] Fonction xml_set_character_data_handler et accent
    Bonjour,

    J'ai fais un script pour parser un document xml en php avec la fonction simplexml_load_file...

    Le script marche très bien, sauf que je dois parser de très gros fichiers de données, et là vu que simplexml_load_file charge tous le fichier en mémoire, ca fais boom !

    Du coup on m'a conseillé d'utiliser xml_parser...

    J'ai trouvé un exemple de code :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
     
    <?php
    $file = "data.xml";
    $depth = array();
     
    function startElement($parser, $name, $attrs) 
    {
        global $depth;
        for ($i = 0; $i < $depth[$parser]; $i++) {
            echo "  ";
        }
        echo "$name\n";
        $depth[$parser]++;
    }
     
    function endElement($parser, $name) 
    {
        global $depth;
        $depth[$parser]--;
    }
     
    $xml_parser = xml_parser_create();
    xml_set_element_handler($xml_parser, "startElement", "endElement");
    if (!($fp = fopen($file, "r"))) {
        die("could not open XML input");
    }
     
    while ($data = fread($fp, 4096)) {
        if (!xml_parse($xml_parser, $data, feof($fp))) {
            die(sprintf("XML error: %s at line %d",
                        xml_error_string(xml_get_error_code($xml_parser)),
                        xml_get_current_line_number($xml_parser)));
        }
    }
    xml_parser_free($xml_parser);
    ?>
    Mais je ne vois pas comment acceder aux noeuds xml de mon fichier...

    Voici une partie de mon script d'origine :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
     
    $xml = simplexml_load_file($source);
     
      foreach($xml->record as $doc)
      {
     
    	$cle = $doc->controlfield;
     
     
    	if($cle['tag']=="001")
    	{
    	  ....
    	}
     
    	foreach($doc->datafield as $field)
    	{
     
    	  $repEtiq[$x]=$field['tag'];		 	  	
    	  foreach($field->subfield as $subfield)
    	  {
    		  $zone.=$subfield['code'];
                      ....
    	  }
    	}
            ......
      }
    Comment faire pour adapter mon script avec xml_parser ?

  2. #2
    Membre actif
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    818
    Détails du profil
    Informations personnelles :
    Âge : 39
    Localisation : France, Drôme (Rhône Alpes)

    Informations forums :
    Inscription : Avril 2005
    Messages : 818
    Points : 288
    Points
    288
    Par défaut
    J'ai quasiment réussi...

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
     
    // Ma propre fonction de traitement des balises ouvrantes
    function fonctionBaliseOuvrante($parseur, $nomBalise, $tableauAttributs)
    {
    	// mémoriser le nom de la balise afin d'en tenir compte dans la fonction "fonctionTexte"
    	global $derniereBaliseRencontree;
    	global $dernierTableauAttributRencontre;
    	global $s,$lgdon,$i,$j,$k,$z,$lg,$ln,$adr,$rep,$etiq,$don,$guide,$repEtiq,$repLg,$repDon,$notice,$tmp,$adrch,$champ,$x,$zone,$ok;
     
    	$derniereBaliseRencontree = $nomBalise;
    	$dernierTableauAttributRencontre = $tableauAttributs;
    	switch ($nomBalise)
    	{
    		case "RECORD":
    		$x=0;
    		break;
     
    		case "DATAFIELD":
    		$repEtiq[$x]=$dernierTableauAttributRencontre['TAG'];
    		if(!empty($dernierTableauAttributRencontre['IND1']))
    			$zone=$dernierTableauAttributRencontre['IND1'];
    		else
    			$zone=" ";
    		if(!empty($dernierTableauAttributRencontre['IND2']))
    			$zone.=$dernierTableauAttributRencontre['IND2'];
    		else
    			$zone.=" ";
    		break;
    	}
    }
     
    // Ma propre fonction de traitement des balises fermantes
    function fonctionBaliseFermante($parseur, $nomBalise)
    {
    	global $derniereBaliseRencontree;
    	global $dernierTableauAttributRencontre;
    	global $s,$lgdon,$i,$j,$k,$z,$lg,$ln,$adr,$rep,$etiq,$don,$guide,$repEtiq,$repLg,$repDon,$notice,$tmp,$adrch,$champ,$x,$zone,$ok;
    	global $cible;
     
    	switch ($nomBalise)
    	{
    		case "DATAFIELD":
    		if (!empty($zone))
    		{
    			$champ=$zone . chr(30);
    			$repLg[$x]=strlen($champ);
    			$repDon.=convertir2($champ);
    			$x+=1;
    		}
    		break;
     
    		case "RECORD" :
    		if ($ok==1)
    		{
    		  $adr=24 + (12 * $x) + 1;
    		  $adrdon=sprintf("%05s",$adr);
    		  $guide = "nam1 22".$adrdon." i 450 ";
    		  $adr=0;
    		  $lg=0;
    		  $lgdon="";
    		  $rep="";
    		  for ($j=0; $j<$x; $j++)
    		  {
    			$adr = $adr + $lg;
    			$adrdon = sprintf("%05s",$adr);
    			$lg = $repLg[$j];
    			$lgdon = sprintf("%04s",$lg);
    			$rep .= $repEtiq[$j].$lgdon.$adrdon;
    		  }
    		  $rep.= chr(30);
    		  $repDon.=chr(29);
    		  $lg = 24 + strlen($rep) + strlen($repDon);
    		  $lgdon = sprintf("%05s",$lg);
    		  $guide = $lgdon.$guide;
    		  $notice=$guide.$rep.$repDon;
    		  // Ouverture du fichier
    		  if (!$fcible = fopen($cible,"a"))
    		  {
    			echo("<p>Impossible de créer le fichier cible ! </p>");
    			break;
    		  }
    		  fwrite($fcible,$notice);
    		}
    		break;
    	}
     
    	// On oublie la dernière balise rencontrée
    	// et tout le reste
    	$derniereBaliseRencontree = "";
    	$dernierTableauAttributRencontre = "";
    }
     
    // Ma propre fonction de traitement du texte
    // qui est appelée par le "parseur"
    function fonctionTexte($parseur, $texte)
    {
    	global $derniereBaliseRencontree;
    	global $dernierTableauAttributRencontre;
    	global $s,$lgdon,$i,$j,$k,$z,$lg,$ln,$adr,$rep,$etiq,$don,$guide,$repEtiq,$repLg,$repDon,$notice,$tmp,$adrch,$champ,$x,$zone,$ok;
     
    	switch ($derniereBaliseRencontree)
    	{
    		case "CONTROLFIELD":
    		if($dernierTableauAttributRencontre['TAG']=='001')
    		{
    			$ok=1;
    			$repEtiq[$x]='001';
    			$champ=trim($texte).chr(30);
    			$repLg[$x]=strlen($champ);
    			$repDon=$champ;
    			$x+=1;
    		}
    		break;
     
    		case "SUBFIELD":
    		$tmp=trim($texte);
    		if(!empty($tmp))
    		{
    		  $zone.=dollar.$dernierTableauAttributRencontre['CODE'];
    		  $zone.=trim($texte);	
    		}
    		break;
    	}         
    }
     
     
    // Création du parseur XML
    $parseurXML = xml_parser_create();
     
    // Je précise le nom des fonctions à appeler
    // lorsque des balises ouvrantes ou fermantes sont rencontrées
    xml_set_element_handler($parseurXML, "fonctionBaliseOuvrante", "fonctionBaliseFermante");
     
    // Je précise le nom de la fonction à appeler
    // lorsque du texte est rencontré
    xml_set_character_data_handler($parseurXML, "fonctionTexte");
     
    // Ouverture du fichier
    $fp = fopen($source, "r");
    if (!$fp)
    {
    	echo("<p>Impossible d'ouvrir le fichier source! </p>");
    	break;
    }
     
    // Lecture ligne par ligne
    while ( $ligneXML = fgets($fp, 1024))
    {
    	xml_parse($parseurXML, $ligneXML, feof($fp)) or	die("Erreur XML");
    }
     
    xml_parser_free($parseurXML);
    fclose($fp);
    Mais il me reste un problème...
    Lorsque je rencontre un accent dans le texte entre deux balises, la fonction fonctionTexte est appelée deux fois...

    Par exemple :

    <subfield>Voilà la solution</subfield>
    La fonction va être appelée une première fois et me retourner : "Voil"
    Et une deuxième fois pour me retourner : "à la solution"

    Alors que je voudrais qu'elle ne soit appelée qu'un fois et me retourne directement : "Voilà la solution"

    Je suis en php5, et apparemment ce problème n'arrive pas avec php4...

    Une idée ?

Discussions similaires

  1. [MySQL] Fonction rechercher et accents
    Par Alesque258 dans le forum PHP & Base de données
    Réponses: 6
    Dernier message: 07/05/2008, 17h21
  2. XML::Parser et les accents
    Par stepmaniac dans le forum Modules
    Réponses: 4
    Dernier message: 29/05/2007, 18h39
  3. [XML fonctions] Existent - elles?
    Par Jean_Benoit dans le forum Oracle
    Réponses: 2
    Dernier message: 10/06/2006, 20h35
  4. [VB6] XML, fonction récursive de recherche
    Par kboo dans le forum VB 6 et antérieur
    Réponses: 3
    Dernier message: 24/04/2006, 21h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo