en fait, voici ce que je veux faire.
J'ai des fichiers sur un site web qui résultent d'une mauvaise utilisation du php. Il se présentent sous cette forme:
Les balises hauti permettent d'injecter le code html.
1 2 3 4 5 6 7 8 9 10 11 12 13
| <? include ('hauti.inc'); ?>
Chant dhonneur
<? include ('hauti2.inc'); ?>
Chant dhonneur
<? include ('hauti3.inc'); ?>
2013
<? include ('hauti4.inc'); ?>
Nous écoutions le chant dantan<br/>
comme si cétait une prière.<br/>
Nous aimions ces sonorités<br/>
.........
<? include ('hauti5.inc'); ?> |
Ce qui donne ceci:
http://www.lygeros.org/2013-fr.php
Je voudrais paser les fichiers pour récupérer le texte qui se trouvent entre les balises <?...?>. Mais je ne vois pas trop comment faire. Utiliser des regex?
J'ai voulu faire ceci:
$texte=preg_split("/[\s]*[<?*?>][\s]*/", $texte);
Qu'en pensez vous? Je pense qu'il risque d'y avoir un problème s'il y a des points d'interrogation dans le texte.
De plus j'aimerais aussi récupérer le nom des balises (hauti5, hauti1...) pour savoir à quoi j'ai affaire
Merci
Partager