Bonjour à tous,
J'essaye d'extraire d'un sitemap les url contenu dans les balise <loc>
J'ai donc fait:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8<url> <loc>http://www.example.com/e/</loc> <lastmod>2013-10-23T19:53:44+01:00</lastmod> <image:image> <image:loc>http://example.com/image.jpg</image:loc> <image:caption><![CDATA[bépo]]></image:caption> </image:image> </url>
Mon soucis est que mon script extrait aussi bien les balise <loc> que <image:loc>
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 $urls = array(); $DomDocument = new DOMDocument(); $DomDocument->preserveWhiteSpace = false; $DomDocument->load('post-sitemap.xml'); $DomNodeList = $DomDocument->getElementsByTagName('loc'); foreach($DomNodeList as $url) { $urls[] = $url->nodeValue; }
auriez vous pour n'extraire que les <loc>?







Répondre avec citation




Partager