Précédent   Forum du club des développeurs et IT Pro > PHP > Langage > Regex
Regex Forum d'entraide sur les expressions rationnelles PHP. Avant de poster -> FAQ regex, Cours de regex et Sources de regex
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse
 
Outils de la discussion
Publicité
'
Vieux 09/11/2012, 17h53   #1
mat8883
 
Inscription : novembre 2012
Messages : 1
Détails du profil
Informations forums :
Inscription : novembre 2012
Messages : 1
Points : -2
Points : -2
Par défaut comment récupérer une chaine entre deux mots

Bonjour,
voilà je fait appel à vous car je suis bloqué...
Je souhaite "simplement" récupérer se qui se trouve entre <table class="infobox_v2" cellspacing="7"> et </table> dans une page distante.
Je sais déjà récupérer tout le code source de la page distante dans une chaîne, mais après je suis bloqué.
Merci beaucoup de votre aide !
mat8883 est déconnecté   Envoyer un message privé Réponse avec citation 02
Vieux 12/11/2012, 17h54   #2
Celira
Modératrice
 
Avatar de Celira
 
Femme
Développeuse PHP/Java
Inscription : avril 2007
Messages : 4 283
Détails du profil
Informations personnelles :
Sexe : Femme
Âge : 28
Localisation : France

Informations professionnelles :
Activité : Développeuse PHP/Java
Secteur : Industrie

Informations forums :
Inscription : avril 2007
Messages : 4 283
Points : 8 416
Points : 8 416
Visiblement, c'est du HTML (donc du xml). Tu peux donc parser le tout avec DOMDocument.

Ou alors utiliser un masque du genre : '#<table class="infobox_v2" cellspacing="7">(.*)</table>#'
__________________
Modératrice PHP
Aucun navigateur ne propose d'extension boule-de-cristal : postez votre code et vos messages d'erreurs. (Rappel : "ça ne marche pas" n'est pas un message d'erreur)

Pour afficher votre code en couleurs : [CODE=php][/CODE] (bouton # de l'éditeur) et [CODEINLINE=php][/CODEINLINE]
Celira est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/11/2012, 15h12   #3
greg91
Membre régulier
 
Avatar de greg91
 
Homme
Indep Web
Inscription : novembre 2007
Messages : 68
Détails du profil
Informations personnelles :
Sexe : Homme
Âge : 38
Localisation : France

Informations professionnelles :
Activité : Indep Web

Informations forums :
Inscription : novembre 2007
Messages : 68
Points : 83
Points : 83
Bonjour Mat,

Code :
1
2
3
4
 
$regex = "<table class=\"infobox_v2\" cellspacing=\"7\">(.+)</table>";
preg_match_all('#'.$regex.'#', $codeSource, $donneeRecupere, PREG_PATTERN_ORDER);
echo $donneeRecupere;
greg91 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/11/2012, 19h29   #4
CosmoKnacki
Membre habitué
 
Avatar de CosmoKnacki
 
Homme
Inscription : mars 2009
Messages : 106
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations forums :
Inscription : mars 2009
Messages : 106
Points : 129
Points : 129
Bonjour,

je te conseil d'ajouter un point d'interrogation aprés le * ou le + sur les exemples précédants, soit *? et +?, car + et * sont des quantificateurs gloutons qui chercheront à avoir le plus grande correspondance possible sauf si tu les "dégloutonnes" avec un point d'interrogation. Donc si tu dois matcher ce code html par exemple et que tu n'as pas fait rempart à la gloutonnerie des quantificateur:
Code :
<table class="infobox_v2" cellspacing="7"><tr><td>haut les mains</td></tr></table><table class="infobox_v2" cellspacing="7"><tr><td>peau de lapin</td></tr></table>
tu obtiendras comme résultat:
Code :
<tr><td>haut les mains</td></tr></table><table class="infobox_v2" cellspacing="7"><tr><td>peau de lapin</td></tr>
qui est la plus grande correspondance possible.

Si dans ta regex tu veux que tous tes quantificateurs se comportent de manière non gloutonne tu peux aussi utiliser le modificateur U (<-- Ungreedy = pas glouton) et ne pas avoir à mettre un point d'interrogation dégloutonnisateur après chacun d'eux (si un jour tu en as plusieurs).

Autre chose, par défaut le "." matche n'importe quel caractère sauf les nouvelles lignes. Pour ça, tu dois utiliser le modificateur s qui permet au point de prendre en compte un passage à la ligne. Sinon si <table et </table> sont sur des lignes différentes, tu ne trouveras rien.

D'où:
Code :
preg_match_all('#<table\sclass="infobox_v2"\scellspacing="7">(.*?)</table>#s', $codeSource, $resultat);
ou avec le modificateur U
Code :
preg_match_all('#<table\sclass="infobox_v2"\scellspacing="7">(.*)</table>#sU', $codeSource, $resultat);
preg_match_all stocke les résultats dans un tableau de tableaux, resultat[1] doit normalement contenir un tableau avec les correspondances de tes premières (et unique) parenthèses capturantes.
CosmoKnacki est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse
Outils de la discussion

Navigation rapide


Fuseau horaire GMT +2. Il est actuellement 14h28.


 
 
 
 
Partenaires

Hébergement Web