p
u
b
l
i
c
i
t
é
publicité
  1. #1

    Inscrit en
    novembre 2012
    Messages
    2
    Détails du profil
    Informations forums :
    Inscription : novembre 2012
    Messages : 2
    Points : -2
    Points
    -2

    Par défaut comment récupérer une chaine entre deux mots

    Bonjour,
    voilà je fait appel à vous car je suis bloqué...
    Je souhaite "simplement" récupérer se qui se trouve entre <table class="infobox_v2" cellspacing="7"> et </table> dans une page distante.
    Je sais déjà récupérer tout le code source de la page distante dans une chaîne, mais après je suis bloqué.
    Merci beaucoup de votre aide !

  2. #2
    Modératrice
    Avatar de Celira
    Femme Profil pro
    Développeuse PHP/Java
    Inscrit en
    avril 2007
    Messages
    5 727
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 30
    Localisation : France

    Informations professionnelles :
    Activité : Développeuse PHP/Java
    Secteur : Industrie

    Informations forums :
    Inscription : avril 2007
    Messages : 5 727
    Points : 11 046
    Points
    11 046

    Par défaut

    Visiblement, c'est du HTML (donc du xml). Tu peux donc parser le tout avec DOMDocument.

    Ou alors utiliser un masque du genre : '#<table class="infobox_v2" cellspacing="7">(.*)</table>#'
    Modératrice PHP
    Aucun navigateur ne propose d'extension boule-de-cristal : postez votre code et vos messages d'erreurs. (Rappel : "ça ne marche pas" n'est pas un message d'erreur)

    Pour afficher votre code en couleurs : [CODE=php][/CODE] (bouton # de l'éditeur) et [CODEINLINE=php][/CODEINLINE]

  3. #3
    Membre régulier Avatar de greg91
    Homme Profil pro
    Indep Web
    Inscrit en
    novembre 2007
    Messages
    83
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Indep Web

    Informations forums :
    Inscription : novembre 2007
    Messages : 83
    Points : 94
    Points
    94

    Par défaut

    Bonjour Mat,

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    $regex = "<table class=\"infobox_v2\" cellspacing=\"7\">(.+)</table>";
    preg_match_all('#'.$regex.'#', $codeSource, $donneeRecupere, PREG_PATTERN_ORDER);
    echo $donneeRecupere;

  4. #4
    Membre émérite Avatar de CosmoKnacki
    Homme Profil pro
    Inscrit en
    mars 2009
    Messages
    556
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : mars 2009
    Messages : 556
    Points : 933
    Points
    933

    Par défaut

    Bonjour,

    je te conseil d'ajouter un point d'interrogation aprés le * ou le + sur les exemples précédants, soit *? et +?, car + et * sont des quantificateurs gloutons qui chercheront à avoir le plus grande correspondance possible sauf si tu les "dégloutonnes" avec un point d'interrogation. Donc si tu dois matcher ce code html par exemple et que tu n'as pas fait rempart à la gloutonnerie des quantificateur:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <table class="infobox_v2" cellspacing="7"><tr><td>haut les mains</td></tr></table><table class="infobox_v2" cellspacing="7"><tr><td>peau de lapin</td></tr></table>
    tu obtiendras comme résultat:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <tr><td>haut les mains</td></tr></table><table class="infobox_v2" cellspacing="7"><tr><td>peau de lapin</td></tr>
    qui est la plus grande correspondance possible.

    Si dans ta regex tu veux que tous tes quantificateurs se comportent de manière non gloutonne tu peux aussi utiliser le modificateur U (<-- Ungreedy = pas glouton) et ne pas avoir à mettre un point d'interrogation dégloutonnisateur après chacun d'eux (si un jour tu en as plusieurs).

    Autre chose, par défaut le "." matche n'importe quel caractère sauf les nouvelles lignes. Pour ça, tu dois utiliser le modificateur s qui permet au point de prendre en compte un passage à la ligne. Sinon si <table et </table> sont sur des lignes différentes, tu ne trouveras rien.

    D'où:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    preg_match_all('#<table\sclass="infobox_v2"\scellspacing="7">(.*?)</table>#s', $codeSource, $resultat);
    ou avec le modificateur U
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    preg_match_all('#<table\sclass="infobox_v2"\scellspacing="7">(.*)</table>#sU', $codeSource, $resultat);
    preg_match_all stocke les résultats dans un tableau de tableaux, resultat[1] doit normalement contenir un tableau avec les correspondances de tes premières (et unique) parenthèses capturantes.

Discussions similaires

  1. [RegExp] Récupérer une chaine entre deux délimiteurs
    Par Soncar dans le forum JavaScript
    Réponses: 8
    Dernier message: 22/02/2011, 21h07
  2. [PHP 5.3] Récupérer une valeur entre deux chaines
    Par thebarbarius dans le forum Regex
    Réponses: 7
    Dernier message: 04/04/2010, 16h47
  3. Réponses: 6
    Dernier message: 17/02/2010, 19h48
  4. Réponses: 2
    Dernier message: 13/08/2008, 14h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo