[DOM] utilisation de loadHTML
Bonjour
J'ai besoin de transformer un fichier html contenant une grosse liste de liens en liste xml pour pouvoir m'y référer plus facilement par la suite avec du javascript( jquery). Je fais donc un loadHTML, puis je recherche les Tags "a".
Code:
1 2 3 4 5 6 7 8 9 10 11
|
$dom = new domDocument ;
$dom->loadHTML(file_get_contents($source."/".$file)) ;
$listeLiens = $dom->getElementsByTagName('a');
foreach($listeLiens as $lien) {
$this->contenu .= "<lien " ;
$this->contenu .= ' ref= "'.$lien->getAttribute("href") . '"';
$this->contenu .= ' titre="'.htmlspecialchars (trim($lien->firstChild->nodeValue)) . '"';
$this->contenu .= " />\n" ;
} |
Tout celà fonctionne, mais je rencontre les problèmes suivants :
1) à l'exécution, php renvoie un avertissement
Citation:
"Warning: DOMDocument::loadHTML() [function.DOMDocument-loadHTML]: Tag titre invalid in Entity, line: 4 in D:\WEB\baseDoc\moteur\fabIndexXML.php on line 40"
2) pour certains liens, j'ai besoin de récupérer des éléments situés en amont du lien pour compléter mon titre. Comment accéder à l'élément précédent dans le DOM ?
Merci si vous pouvez m'éclairer !