IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

 Delphi Discussion :

Expression régulières: de PCRE à System.RegularExpressions


Sujet :

Delphi

  1. #1
    Membre du Club
    Homme Profil pro
    Aucune
    Inscrit en
    Juillet 2019
    Messages
    49
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Aucune

    Informations forums :
    Inscription : Juillet 2019
    Messages : 49
    Points : 41
    Points
    41
    Par défaut Expression régulières: de PCRE à System.RegularExpressions
    Bonjour


    J'ai delphi 10.3 version starter et souhaite parser une page web à partir des expression régulières.

    J ai récupéré une source de 2008 qui utilise PCRE qui est un exemple pas à pas tres detaillé.

    J ai donc mis dans mes uses System.RegularExpressions pour pouvoir parser le contenu de la page qui est récupérée par idhttp et stocké dans un tmemo.text tout comme dans mon 'modèle'.

    Le pb est que cette vielle source contient des fonctions qui ne sont pas dans l'unit System.RegularExpressions.

    J aimerais connaitre leurs 'équivalences' s il vous plait.

    il s agit de RegexMatchedExpression et RegexAllMatchedSubExpression

    J ai bien cherché RegexMatchedExpression System.RegularExpressions dans google mais en vain. J ai regardé la FAQ https://delphi.developpez.com/faq/?p...ons-regulieres mais n'y ai pas trouvé ce que je cherchais ou alors je n ai pas compris, ce qui est aussi fort possible.

    Le code suivant à pour objectif de
    1/ récupérer le 3eme tableau de la page puis...
    2/ boucler sur chaque ligne de ce 3eme tableau et enfin...
    3/ boucler sur les colonnes de cette ligne pour récupérer celle qui m intéresse :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
     table := RegexMatchedExpression(page, '<table.*?>.*?</table>', 3);
     
      rows := TStringList.create;
      RegexAllMatchedSubExpression(rows, table, '<tr.*?>(.*?)</tr>');
      for r:= 0 to rows.count-1 do begin 
        cols := TStringlist.create;
        RegexAllMatchedSubExpression(cols, rows[r], '<td.*?>(.*?)</td>');
     
        for c := 1 to cols.count-1 do begin  
          if r=0 then begin
            Cequejeveux[c-1] := cols[c];
    Merci pour votre aide.

  2. #2
    Membre émérite

    Homme Profil pro
    Développeur informatique
    Inscrit en
    Novembre 2007
    Messages
    3 388
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 3 388
    Points : 2 999
    Points
    2 999
    Par défaut
    l'équivalent c'est la fonction Matches

    System.RegularExpressions.TRegEx.Matches

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
      var
        Matches: TMatchCollection;
        Match: TMatch;
      begin
        Matches := TRegex.Matches('truc troc tric trac', 'tr[aeiou]{1}');
        for Match in Matches do
          ShowMessage(Match.Value);
    affiche
    tru
    tro
    tri
    tra

  3. #3
    Membre du Club
    Homme Profil pro
    Aucune
    Inscrit en
    Juillet 2019
    Messages
    49
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Aucune

    Informations forums :
    Inscription : Juillet 2019
    Messages : 49
    Points : 41
    Points
    41
    Par défaut
    Merci,

    Par contre peux tu me confirmer que cela fait bien 'appel' à PCRE car je teste mes regex sur https://regex101.com/ et elles fonctionnent mais quand je passe en delphi matches.Count = 0 !

    Par exemple la regegex <table.*?>.*?</table> ne fonctionne ni sur le site ni en delphi. je l ai remplacé par une plus précise (simple_02.gif">(?:.|\n)*(?=<\/tbody>)) qui fonctionne parfaitement sur le site mais ne me retourne toujours rien en delphi.

    Pour info je cherche à récupérer les rapports au jeu simple sur cette page (numéro du cheval, gagnant ou placé et rapport) http://www.geny.com/arrivee-et-rappo...-turf_c1102210

    Merci pour ton aide

  4. #4
    Membre émérite

    Homme Profil pro
    Développeur informatique
    Inscrit en
    Novembre 2007
    Messages
    3 388
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 3 388
    Points : 2 999
    Points
    2 999
    Par défaut
    c'est plutôt :

    <table.*?>.*?<\/table>

    Delphi utilise PCRE mais avec quelques restrictions mineures.

    Attention au site regex101 qui parfois donne des résultats qui ne passent pas en Delphi parce qu'il est orienté PHP.

    Il faudrait un exemple de texte à tester avec la regex pour mieux comprendre

  5. #5
    Membre du Club
    Homme Profil pro
    Aucune
    Inscrit en
    Juillet 2019
    Messages
    49
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Aucune

    Informations forums :
    Inscription : Juillet 2019
    Messages : 49
    Points : 41
    Points
    41
    Par défaut
    Voici un exemple de code que je souhaite parser

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
     
    ...du html...
    <table style="width: 100%;">
    <tbody>
    	<tr>
    		<td width="150" bgcolor="#F5F5F5" class="blancdouble" height="32" style="border-top:1px solid #999999; text-align: center;">
    		     <img height="22px" src="/web/images/pictos/paris/simple_02.gif">
    	        </td>
    		<td bgcolor="#F5F5F5" class="blancdroite" align="center" style="border-top:1px solid #999999;">pour<b> 1 &euro;</b></td>
    	</tr>
    	<tr><td class="ncdouble1" width="150" height="20">
    									<div style="float: left">
    													<b>1</b>
    ... d autres lignes...
    </tbody>
    			</table>
    		</tr></table><br/>
    <table id="lesDuos"><tr>
    Etant donné qu il y a plusieurs tableaux dans la page et que seul celui qui m intéresse contient simple_02.gif j imaginais qu il est plus simple d'extraire toute la partie entre cette image et le </tbody> du tableau.

    concernant le pattern <table.*?>.*?<\/table>, il me retourne aussi un résultat vide aevc le code suivant :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    Stg := IdHTTP1.Get
        ('http://www.geny.com/arrivee-et-rapports-pmu/2019-10-16-pmu-grand-national-du-trot-paris-turf_c1102210');
      Matches := TRegEx.Matches(stg, '<table.*?>.*?<\/table>');
    J ai téléchargé RegexTester ici https://sourceforge.net/projects/regextester/ et ce pattern retroune effectivement les 26 tableaux de la page ...

    Existerait il un site ou une appli pour tester les regex spécifiquement comme interprété par delphi ?

    Merci pour ta patience

  6. #6
    Rédacteur/Modérateur

    Avatar de SergioMaster
    Homme Profil pro
    Développeur informatique retraité
    Inscrit en
    Janvier 2007
    Messages
    15 043
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 67
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Janvier 2007
    Messages : 15 043
    Points : 40 957
    Points
    40 957
    Billets dans le blog
    62
    Par défaut
    Bonjour,
    Citation Envoyé par Debutant_pc Voir le message
    Existerait-il un site ou une appli pour tester les regex spécifiquement comme interprété par delphi ?
    J'utilise Expresso qui satisfait mes besoins quand j'ai besoins de tester ou écrire des expressions régulières pour mes programmes.

    que seul celui qui m'intéresse contient simple_02.gif
    En regardant le code source de la page indiquée j'écrirais qu'il faut
    1- récupérer le tableau
    Code expression : Sélectionner tout - Visualiser dans une fenêtre à part
    <table id="lesSolos">.*<table id=
    2- récupérer (par une autre expression ou XML à voir) la seconde table à l'intérieur du résultat
    Code expression : Sélectionner tout - Visualiser dans une fenêtre à part
    <table>.*<i>PMU<\/i>.*<\/table>

    les expressions indiquées ne sont qu'un ébauche imparfaite, écrites de mémoire sans tester, c'est plus pour indiquer ce que j'aurais recherché soit :
    à l'intérieur de "lesSolos" le tableau qui contient PMU (pas PMU.FR d'où l'utilisation des <i> </i>)

    Tout de même, je me demande si récupérer la page entière et passer par XMLDocument ne serait pas plus efficace
    MVP Embarcadero
    Delphi installés : D3,D7,D2010,XE4,XE7,D10 (Rio, Sidney), D11 (Alexandria), D12 (Athènes)
    SGBD : Firebird 2.5, 3, SQLite
    générateurs États : FastReport, Rave, QuickReport
    OS : Window Vista, Windows 10, Windows 11, Ubuntu, Androïd

  7. #7
    Membre émérite

    Homme Profil pro
    Développeur informatique
    Inscrit en
    Novembre 2007
    Messages
    3 388
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 3 388
    Points : 2 999
    Points
    2 999
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
        Matches := TRegex.Matches(Stg, '<table.*?>.*?<\/table>', [TRegExOption.roSingleLine]);
        for Match in Matches do
          ShowMessage(Match.Value);

  8. #8
    Membre émérite

    Homme Profil pro
    Développeur informatique
    Inscrit en
    Novembre 2007
    Messages
    3 388
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Novembre 2007
    Messages : 3 388
    Points : 2 999
    Points
    2 999
    Par défaut
    J'utilise aussi Expresso mais il a un problème que le développeur n'a jamais réglé.
    Si ton OS est réglé avec le point comme séparateur décimal, il ne se lance pas.
    En tous cas, c'est comme ça sur mon Windows 8.1 64 bits.

    J'avais signalé le bug mais il n'a jamais été corrigé.
    C'est dommage pour un outil aussi utile :-(

  9. #9
    Membre du Club
    Homme Profil pro
    Aucune
    Inscrit en
    Juillet 2019
    Messages
    49
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Aucune

    Informations forums :
    Inscription : Juillet 2019
    Messages : 49
    Points : 41
    Points
    41
    Par défaut
    Citation Envoyé par Papy214 Voir le message
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
        Matches := TRegex.Matches(Stg, '<table.*?>.*?<\/table>', [TRegExOption.roSingleLine]);
        for Match in Matches do
          ShowMessage(Match.Value);
    MERCI !!!
    ça fonctionne enfin !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 7
    Dernier message: 15/10/2019, 10h07
  2. [RegEx] expression régulière regex PCRE
    Par fleedalfire dans le forum Langage
    Réponses: 16
    Dernier message: 25/10/2017, 15h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo