Publicité
+ Répondre à la discussion
Affichage des résultats 1 à 4 sur 4
  1. #1

    Inscrit en
    novembre 2012
    Messages
    1
    Détails du profil
    Informations forums :
    Inscription : novembre 2012
    Messages : 1
    Points : -2
    Points
    -2

    Par défaut comment récupérer une chaine entre deux mots

    Bonjour,
    voilà je fait appel à vous car je suis bloqué...
    Je souhaite "simplement" récupérer se qui se trouve entre <table class="infobox_v2" cellspacing="7"> et </table> dans une page distante.
    Je sais déjà récupérer tout le code source de la page distante dans une chaîne, mais après je suis bloqué.
    Merci beaucoup de votre aide !

  2. #2
    Modératrice
    Avatar de Celira
    Femme Profil pro
    Développeuse PHP/Java
    Inscrit en
    avril 2007
    Messages
    5 197
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 29
    Localisation : France

    Informations professionnelles :
    Activité : Développeuse PHP/Java
    Secteur : Industrie

    Informations forums :
    Inscription : avril 2007
    Messages : 5 197
    Points : 10 009
    Points
    10 009

    Par défaut

    Visiblement, c'est du HTML (donc du xml). Tu peux donc parser le tout avec DOMDocument.

    Ou alors utiliser un masque du genre : '#<table class="infobox_v2" cellspacing="7">(.*)</table>#'
    Modératrice PHP
    Aucun navigateur ne propose d'extension boule-de-cristal : postez votre code et vos messages d'erreurs. (Rappel : "ça ne marche pas" n'est pas un message d'erreur)

    Pour afficher votre code en couleurs : [CODE=php][/CODE] (bouton # de l'éditeur) et [CODEINLINE=php][/CODEINLINE]

  3. #3
    Membre régulier Avatar de greg91
    Homme Profil pro
    Indep Web
    Inscrit en
    novembre 2007
    Messages
    78
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France

    Informations professionnelles :
    Activité : Indep Web

    Informations forums :
    Inscription : novembre 2007
    Messages : 78
    Points : 90
    Points
    90

    Par défaut

    Bonjour Mat,

    Code :
    1
    2
    3
    4
     
    $regex = "<table class=\"infobox_v2\" cellspacing=\"7\">(.+)</table>";
    preg_match_all('#'.$regex.'#', $codeSource, $donneeRecupere, PREG_PATTERN_ORDER);
    echo $donneeRecupere;

  4. #4
    Membre éclairé Avatar de CosmoKnacki
    Homme Profil pro
    Inscrit en
    mars 2009
    Messages
    256
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : mars 2009
    Messages : 256
    Points : 350
    Points
    350

    Par défaut

    Bonjour,

    je te conseil d'ajouter un point d'interrogation aprés le * ou le + sur les exemples précédants, soit *? et +?, car + et * sont des quantificateurs gloutons qui chercheront à avoir le plus grande correspondance possible sauf si tu les "dégloutonnes" avec un point d'interrogation. Donc si tu dois matcher ce code html par exemple et que tu n'as pas fait rempart à la gloutonnerie des quantificateur:
    Code :
    <table class="infobox_v2" cellspacing="7"><tr><td>haut les mains</td></tr></table><table class="infobox_v2" cellspacing="7"><tr><td>peau de lapin</td></tr></table>
    tu obtiendras comme résultat:
    Code :
    <tr><td>haut les mains</td></tr></table><table class="infobox_v2" cellspacing="7"><tr><td>peau de lapin</td></tr>
    qui est la plus grande correspondance possible.

    Si dans ta regex tu veux que tous tes quantificateurs se comportent de manière non gloutonne tu peux aussi utiliser le modificateur U (<-- Ungreedy = pas glouton) et ne pas avoir à mettre un point d'interrogation dégloutonnisateur après chacun d'eux (si un jour tu en as plusieurs).

    Autre chose, par défaut le "." matche n'importe quel caractère sauf les nouvelles lignes. Pour ça, tu dois utiliser le modificateur s qui permet au point de prendre en compte un passage à la ligne. Sinon si <table et </table> sont sur des lignes différentes, tu ne trouveras rien.

    D'où:
    Code :
    preg_match_all('#<table\sclass="infobox_v2"\scellspacing="7">(.*?)</table>#s', $codeSource, $resultat);
    ou avec le modificateur U
    Code :
    preg_match_all('#<table\sclass="infobox_v2"\scellspacing="7">(.*)</table>#sU', $codeSource, $resultat);
    preg_match_all stocke les résultats dans un tableau de tableaux, resultat[1] doit normalement contenir un tableau avec les correspondances de tes premières (et unique) parenthèses capturantes.

Liens sociaux

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •