Bonjour à tous
j'utilise un socket pour récupérer le code HTML d'une page. ensuite, j'essaye de le parser, pour retrouver des bouts d'HTML, et en ressortir des données.
petit hic : ereg ne me retrouve pas les chaines avec des accents :/ voici mon format regex :
<a href="viewforum.php\?f=([0-9]{1,})&sid=[[:alnum:]]{32}" class="forumlink">([[:graph:][:space:]]*)</a>
ce qui pose problème, c'est [[:graph:][:space:]]*. pour info, mon fichier .php est encodé en utf8, je sais pas si ça peut changer quelque chose. sachant que j'ai essayé utf8_encode et utf8_decode sur l'HTML récupéré via le socket, sans changement sur le ereg.
quelqu'un a une idée ?






Répondre avec citation





Partager