Précédent   Forum des professionnels en informatique > PHP > Langage > Regex
Regex Forum d'entraide sur les expressions rationnelles PHP. Avant de poster -> FAQ regex, Cours de regex et Sources de regex
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 02/07/2008, 12h50   #1
Invité de passage
 
Inscription : mai 2008
Messages : 12
Détails du profil
Informations forums :
Inscription : mai 2008
Messages : 12
Points : 3
Points : 3
Par défaut Expression Régulière ou utilisation des DOM

Bonjour à tous,

Je suis bloqué dans le developpement d'un script chargé de récupérer un fichier html à partir d'une url, de la scanner et de créer un fichier xml pour enrichir un fichier de prospection. J'ai hésité à utiliser les DOM, mais je n'y ai rien compris. Donc je suis revenu aux expressions régulières.

je ne sais pas comment réussir à récupérer dans un tableau tout le code HTML contenu entre deux balises de paragraphes <p> ... </p>.

ma piste
Code :
#<p><strong>([[:print:][:space:]]*)</p>#
ne m'amène pas bien loin. Car je récupère trop d'élément d'un coup.

Je cherche une chaine de ce type :
Code :
#<p><strong>(^</p>)*</p>#
mais ça ne fonctionne pas :'(

Une autre question, comment choisir entre expression régulière et DOM. Le plus simple serait d'avoir une classe qui me permette d'accéder à un tableau de tous les éléments "<P>" de ma page. J'ai une idée pour un code Javascript, mais pas pour PHP.

En espérant avoir été clair & Merci d'avance pour votre aide.
BigDozer est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/07/2008, 12h51   #2
Invité de passage
 
Inscription : mai 2008
Messages : 12
Détails du profil
Informations forums :
Inscription : mai 2008
Messages : 12
Points : 3
Points : 3
petite précision, j'utilise la fonction preg_match_all()
BigDozer est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/07/2008, 09h58   #3
Invité de passage
 
Inscription : mai 2008
Messages : 12
Détails du profil
Informations forums :
Inscription : mai 2008
Messages : 12
Points : 3
Points : 3
Après une série de test, je n'arrive toujours pas au résultat voulu, c'est à dire récupérer tout le contenu entre un <p> et un le premier </p> de fermeture. Car tantôt je récupère simplement le premier contenu, soit je récupère tout le contenu HTML entre la première balise d'ouverture de la page et la dernière de la page.

Je compte sur votre aide ou simplement une orientation.

Merci.
BigDozer est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/07/2008, 10h08   #4
Expert Confirmé
 
Avatar de Eusebe
 
Inscription : mars 2006
Messages : 1 989
Détails du profil
Informations personnelles :
Âge : 34

Informations forums :
Inscription : mars 2006
Messages : 1 989
Points : 3 606
Points : 3 606
Un petit coup de pouce : essaie d'utiliser le modificateur U qui permet de récupérer la plus petite chaîne qui correspond au modèle : http://g-rossolini.developpez.com/tu...e=page_2#LII-7
Eusebe est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 07/07/2008, 11h59   #5
Invité de passage
 
Inscription : mai 2008
Messages : 12
Détails du profil
Informations forums :
Inscription : mai 2008
Messages : 12
Points : 3
Points : 3
Ça marche parfaitement. Je m'étais tellement penché sur la définition de mon expression que j'en avais oublié le délimiteur.

Un Grand MERCI !
BigDozer est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 03h46.


 
 
 
 
Partenaires

Hébergement Web