Précédent   Forum des professionnels en informatique > PHP > Langage > Regex
Regex Forum d'entraide sur les expressions rationnelles PHP. Avant de poster -> FAQ regex, Cours de regex et Sources de regex
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 08/12/2006, 00h23   #1
Invité régulier
 
Inscription : décembre 2006
Messages : 6
Détails du profil
Informations forums :
Inscription : décembre 2006
Messages : 6
Points : 7
Points : 7
Par défaut Extraire des informations d'un texte

Bonjour , je cherche a faire un parser php pour extraire des donnees a partir d'un fichier html.
exemle:
Code html :
1
2
3
4
5
6
7
8
9
<html>
......
 <P><!-- Authors: S Akl and G Toussaint --></P>
  <DT><A name=akl-toussaint78>[5]</A>
  <DD>S.&nbsp;Akl and G.&nbsp;Toussaint. Fast convex hull algorithm. <CITE><A 
  href="http://www.elsevier.com/locate/ipl">Information Processing 
  Letters</A></CITE>, 7(5):219-222, August 1978.
...
</html>
je veux extraire :@auteur =S Akl and G Toussaint
@article=Fast convex hull algorithm
@lien=http://www.elsevier.com/locate/ipl">
@date=August 1978.
merci d'avance
mmansour79 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/12/2006, 09h30   #2
Modérateur
 
Avatar de s.n.a.f.u
 
Homme
Développeur Web
Inscription : août 2006
Messages : 2 700
Détails du profil
Informations personnelles :
Sexe : Homme
Âge : 37
Localisation : France, Loire Atlantique (Pays de la Loire)

Informations professionnelles :
Activité : Développeur Web

Informations forums :
Inscription : août 2006
Messages : 2 700
Points : 3 357
Points : 3 357
Bonjour,

Je ne sais pas si je vais tomber juste, mais je n'ai pas l'impression que le résultat final de vos demandes doit être disponible sur un serveur web. J'ai l'impression qu'il s'agit d'extractions pour listing ou autre, je me gourre ?

Imaginons le cas complètement fou ou je puisse avoir raison (je le noterais dans mes annales ), je pense que php n'est pas l'outil idéal pour ce genre de travail.

Perl ou Python (ou Ruby que je ne connais pas) ferons ça bien mieux.

Et pardon si je suis hors-sujet.
s.n.a.f.u est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/12/2006, 11h41   #3
En attente de confirmation mail
 
Inscription : juin 2002
Messages : 6 164
Détails du profil
Informations forums :
Inscription : juin 2002
Messages : 6 164
Points : 6 404
Points : 6 404
Et l'extension PCRE ?

La fonction preg_match_all semble appropriée à votre cas. Exemple :
Code :
1
2
3
4
5
6
7
8
<?php
$texte = '<html> ...... <P><!-- Authors: S Akl and G Toussaint --></P>  <DT><A name=akl-toussaint78>[5]</A>  <DD>S.&nbsp;Akl and G.&nbsp;Toussaint. Fast convex hull algorithm. <CITE><A href="http://www.elsevier.com/locate/ipl">Information Processing Letters</A></CITE>, 7(5):219-222, August 1978. ... </html>';
if (($count = preg_match_all('#<!-- Authors: (.+) -->#U', $texte, $m)) >= 1) {
    for ($i = 0; $i < $count; $i++) {
        echo $m[1][$i] . '<br/>';
    }
}
?>
Je vous recommande de lire le tutoriel d'initiation aux expressions régulières.


Julp.
julp est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 09h08.


 
 
 
 
Partenaires

Hébergement Web