IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Utilisation de preg_match_all


Sujet :

Langage PHP

  1. #1
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2012
    Messages
    14
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Octobre 2012
    Messages : 14
    Points : 10
    Points
    10
    Par défaut Utilisation de preg_match_all
    Bonjour, alors je ne sais pas si je suis dans la bonne section mais ma requête concerne les expressions régulières.

    Alors voilà mon problème.
    Soit l'url suivante: http://www.developpez.com/actu/46946...al-et-MongoDB/

    Tout en bas de la page il y a une section réservée aux commentaires, j'aimerais récupérer ces commentaires, en fait seul le texte m'intéresse mais si ça récupère les liens et les images aussi, ce sont des détails Alors déjà je pense que dans mon code, je me fais gêner par les "/", mais même en utilisant un str_replace(), je n'ai pas réussi à résoudre mon problème. Je pense qu'il y a également d'autres problèmes que je n'ai pas relevé :/

    Voici le code en question:
    Code PHP : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    function recup_avis()
    {
    	$url = "http://www.developpez.com/actu/46946/La-Maison-Blanche-fait-de-l-open-source-et-publie-sa-premiere-application-sur-GitHub-We-The-People-est-sous-Drupal-et-MongoDB/";
    	$source = file_get_contents($url);
    	$source = str_replace(CHR(13),"",$source); //ici je vire les retours chariot
    	$source = str_replace(CHR(10),"",$source); // pareil
    	$expression = '/<span class="comment" style="width:10px;"></span> Retrouver la discussion sur le forum</a>(.+?)<a class="forumLink" href="http://www.developpez.net/forums/showthread.php?t=1256287"><span class="comment" style="width:10px;"></span>Retrouvez la suite de la discussion</a>/';
    	$resultat = preg_match_all($expression, $source, $res);		
    	if( $resultat ){
               echo '<strong>'."Avis: " . '</strong>'.$res[1][0].'</br></br>'; 
    	}else echo '<strong>'."Avis: " . 'Pas de resultat.'.'</br></br>';
    }

  2. #2
    Expert éminent sénior
    Avatar de rawsrc
    Homme Profil pro
    Dev indep
    Inscrit en
    Mars 2004
    Messages
    6 142
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Dev indep

    Informations forums :
    Inscription : Mars 2004
    Messages : 6 142
    Points : 16 545
    Points
    16 545
    Billets dans le blog
    12
    Par défaut
    Pour ce genre de pompage data mining, il faut directement aller consulter le bon Dieu : Anomaly
    Gaffe à l'enfer quand même

  3. #3
    Expert éminent Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 848
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 848
    Points : 6 535
    Points
    6 535
    Par défaut
    Bonjour,

    moi je ferais comme ça:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    <?php
    // on récupère les éléments intéressants
    $pattern="/<div\sclass=\"postUser\">\s*
    		       <img\sclass=\"posterAvatar\"\ssrc=\"
    		           ([^\"]*)\" # lien de l'avatar
    		               [^>]*>\s*
    		       ([^<]*) # pseudo
    		       <br\/>\s*
    		       ([^<]*) # qualité
    		       <br\/>\s*le\s
    		       ([^<]*) # date du post
    		       <br\/>\s*
    		   <\/div>\s*
    		   <div\sclass=\"postMessage\">
    		       (.*?) # code html du post
            \s*<\/div>\s*
           <\/div>\s*
           (?:<div\sclass=\"postComment\">|<!--) # chaque post se termine par le suivant, sauf le dernier
    		           /sx";
     
    $resultat=preg_match_all($pattern, $page,$res);
     
    array_shift($res); // on enlève le match de toute la pattern 
     
    // un peu de nettoyage (à creuser)
    $patternClean=array("/<img\ssrc=\"http:\/\/www\.developpez\.net\/forums\/images\/smilies.*?title=\"([^\"]*)\"[^>]*>/s", // smilies
    				    "/<a\shref=\"http:\/\/www\.developpez\.net\/forums\/showthread.*?<\/a>/s", // liens entre posts des citations
    				    "/\sclass=\".*?\"/s", // classes inutiles
    				    "/\s*\/>/", // maniaquerie de fermeture de balise
    				    "/(\w)\s([.,?!])/s" // faute de typographie
    					); 
    $replaceClean=array("$1",">>","","/>","$1$2");				  
     
    $res[4]=preg_replace($patternClean,$replaceClean,$res[4]);
     
    // affichage top design!
    for ($i=0;$i<count($res[0]);$i++)
    {
    	echo <<<LOD
    		  lien avatar: {$res[0][$i]}<br/>
    		  auteur: {$res[1][$i]}<br/>
    		  qualité: {$res[2][$i]}<br/>
    		  date: {$res[3][$i]}<br/>
    		  <div>{$res[4][$i]}</div><br/>
    LOD;
    }
     
    ?>
    Brachygobius xanthozonus
    Ctenobrycon Gymnocorymbus

  4. #4
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2012
    Messages
    14
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Octobre 2012
    Messages : 14
    Points : 10
    Points
    10
    Par défaut
    Wow solution super clean ! Merci comme je suis débutant en PHP je suis en train d'essayer de comprendre mais globalement c'est ce que je cherche! Merci bien

  5. #5
    Expert éminent Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 848
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 848
    Points : 6 535
    Points
    6 535
    Par défaut
    À la bonne heure!

    Attention néanmoins à ne pas mettre ton résultat en ligne sur une autre url ou à submerger un serveur qui ne t'appartient pas de requêtes.
    Brachygobius xanthozonus
    Ctenobrycon Gymnocorymbus

Discussions similaires

  1. [RegEx] Utilisation de preg_match_all
    Par Invité dans le forum Langage
    Réponses: 7
    Dernier message: 31/10/2008, 21h02
  2. [RegEx] Utilisation de preg_match_all pour un fichier externe
    Par divad dans le forum Langage
    Réponses: 6
    Dernier message: 07/05/2008, 13h10
  3. [RegEx] Utilisation de preg_match_all
    Par pifoux2000 dans le forum Langage
    Réponses: 2
    Dernier message: 28/02/2008, 11h06
  4. [RegEx] Utilisation de preg_match_all
    Par Christophe Charron dans le forum Langage
    Réponses: 5
    Dernier message: 28/07/2007, 15h35
  5. [RegEx] Problème d'utilisation de preg_match_all()
    Par hemgui dans le forum Langage
    Réponses: 7
    Dernier message: 16/05/2007, 18h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo