Bonjour,
Je dois "crawler" de nombreuses pages de sites afin de récupérer leur contenu (avec l'accord des intéressés, bien entendu), puis récupérer certaines données contenues dans ces pages.
Le problème est que j'ai une 30 aine de données à récupérer par page, et j'hésite entre faire 3 ou 4 preg_match() assez complexes, mais récupérant une 10aine de données par expression, ou une preg_match par donnée afin d'avoir des règles beaucoup plus simples.
Voici un exemple :
D'après-vous, quelle est la meilleure solution : créer quelques règles assez complexes (afin de limiter le nombre de fois où le fichier sera parcouru), ou créer des règles simples mais parcourir plus de fois l'ensemble du document?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 preg_match('`<h1>(.*) \([0-9]+\)</h1>.*<p />(.*)</div>.*<td>Nombre de personnes : ([-0-9]+)</td>.*<td>Terrain : (-|[ 0-9]*)(?: m²)?</td>'. '.*<div class="titre">.*phone : ([ 0-9]*)<br />'. '.*href="mailto:(.*)".*</a><br />(.*)<br />([0-9]+) (.*)<br />`Uis', $codeHtml, $matches);
Merci d'avance pour vos conseils!
Partager