getElementsByTagNameNS : Récupérer les balises w:Sdt d'un fichier Word au format html

**Alex101283** · 10/07/2019, 17h52

Bonjour à tous,

Je débute le PHP depuis quelques jours et dans le cadre de mon projet, je dois lire un fichier word enregistré au format html (TemplateDemo.html) puis récupérer le contenu des balises de "w:Sdt" présente dans ce fichier.

Extrait du fichier TemplateDemo.html:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<html xmlns:v="urn:schemas-microsoft-com:vml"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:w="urn:schemas-microsoft-com:office:word"
xmlns:m="http://schemas.microsoft.com/office/2004/12/omml"
xmlns="http://www.w3.org/TR/REC-html40">
 
</head>
 
<body lang=FR style='tab-interval:35.4pt'>
 
<div class=WordSection1>
 
<p class=MsoNormal>Bonjour <w:Sdt DocPart="06F41A9E3F1AD443B6220BEA9C32380D"
 Title="NOM" SdtTag="VAR" ID="950663817">NOM1</w:Sdt>,</p>
 
<p class=MsoNormal><o:p>&nbsp;</o:p></p>

Voici mon code PhP pour lire le contenue du fichier TemplateDemo.html et récupérer le contenu des balises <w:Sdt>:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
//Extract data from TemplateDemo.html
$content = file_get_contents( dirname( __FILE__ ) . '/TemplateDemo.html' );
  if ($content === false) echo "ERROR CANNOT READ TEMPLATEDEMO file";
//Extraction of <w:Std> tags included in Word Template
$dom = new DOMDocument();
$dom->loadHTML($content);
		foreach ($dom->getElementsByTagNameNS('*', 'w:std') as $element) {
    echo 'local name: ', $element->localName, ', prefix: ', $element->prefix, "\n";
}

Le echo ne me renvoi rien. J'ai essayé de suivre à la lettre la documentation PhP:

https://www.php.net/manual/fr/domdoc...ytagnamens.php

Est ce que quelqu'un peut m'aiguiller svp ?

AG

getElementsByTagNameNS : Récupérer les balises w:Sdt d'un fichier Word au format html

Langage PHP

Mode arborescent

Discussions similaires

Partager

Partager