IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Delphi Discussion :

Composant d'expression régulière en pointeur


Sujet :

Langage Delphi

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Mai 2003
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 22
    Points : 16
    Points
    16
    Par défaut Composant d'expression régulière en pointeur
    Bonjour a tous, amis développeurs,

    J'aimerai svoir si l'un de vous connaitrait des composants identique a "RegExpr"
    pour traiter des expressions régulières a ceci près que ces composants devraient prendre en parametre un pointeur (PCHAR) au lieu d'une String comme c'est le cas dans RegExpr.

    En effet l'application que je développe doit utiliser les expressions régulières dans des fichiers de textes qui dépassent souvent le méga-octets.

    Et jusqu'ici j'utilise le composant RegExpr mais celui ci prenant en paramètre une String (soit tout mon texte a traiter), un texte de 5Mo met trop de temps a être traiter et si le composant fonctionnait par pointeur le traitement sera bcp plus rapide.


    Merci d'avance a ceux qui ont déjà utilisé les expressions régulières si ils connaissent une composant de ce type (ou voir si quelqu'un d'acharné saurait convertir le composant RegExpr pour lui faire prendre un PChar en paramètre).


    Merci pour votre attention et aussi pour tout ce que j'ai déjà apprit chaque jours en Delphi grace a votre site, ses inépuisables ressources et son Forum des plus vivants et conviviale.
    ____@.BaMbInO.@____

  2. #2
    Membre actif
    Avatar de Eric.H
    Homme Profil pro
    Inscrit en
    Décembre 2004
    Messages
    220
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Décembre 2004
    Messages : 220
    Points : 286
    Points
    286
    Par défaut
    si tu as les sources de RegExpr, voir si tu peux mettre const devant la declaration.... ma_fonction(const ma_chaine:string) ou alors var, si RegExpr ne modifie pas la variable ( à verifier dans le cas de var, si la chaine est modifiée apres la fonction )

    const permet à delphi d'optimiser
    var delphi passe le pointeur de la variable

  3. #3
    Expert éminent sénior

    Avatar de sjrd
    Homme Profil pro
    Directeur de projet
    Inscrit en
    Juin 2004
    Messages
    4 517
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Suisse

    Informations professionnelles :
    Activité : Directeur de projet
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2004
    Messages : 4 517
    Points : 10 152
    Points
    10 152
    Par défaut
    Sais-tu seulement qu'une variable string est un pointeur ?! Mais toutes les opérations nécessaires à leur copie/traitement sont transformée par le compilateur pour gérer le compteur de référence, faire des copies des chaînes quand il faut etc.
    Donc le traitement est tout aussi rapide en string qu'en PChar aucune raison de chercher qqch qui fonctionne en PChar
    sjrd, ancien rédacteur/modérateur Delphi.
    Auteur de Scala.js, le compilateur de Scala vers JavaScript, et directeur technique du Scala Center à l'EPFL.
    Découvrez Mes tutoriels.

  4. #4
    Membre actif
    Avatar de Eric.H
    Homme Profil pro
    Inscrit en
    Décembre 2004
    Messages
    220
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Décembre 2004
    Messages : 220
    Points : 286
    Points
    286
    Par défaut
    Citation Envoyé par sjrd
    Sais-tu seulement qu'une variable string est un pointeur ?!
    Tout dépend des options du compilateur coche "Chaine vaste"

    Ce qui l'embette a mon avis c'est le passage de variable même si tu passe un String "Vaste" (AnsiString) en parametre, le compilo doit en faire une copie en memoire a moins de lui mettre un VAR devant

    Delphi en interne gere le AnsiString comme un PChar... mais pour le programmeur il a quasimment le même comportement que "l'ancien" string ShortString

  5. #5
    Membre à l'essai
    Profil pro
    Inscrit en
    Mai 2003
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 22
    Points : 16
    Points
    16
    Par défaut
    oui Eric.h a tout a fait raison, tout le memo est copier dans une nouvelle variable string que regexpr refait apres chaque passe, donc il suffit que le fichier texte fasse 5 mo et que l'expresison regulière qu'on veuille utiliser soit sensée ramener pleins de resultats pour que le traitement prene 10 minutes.

    ce qui ne serait pas le cas si il pouvait directement pointer sur le texte de mon memo

    mais meric bcp pour toutes vos reponse et je suis encore ouvert a toutes sorte de suggestions
    ____@.BaMbInO.@____

  6. #6
    Membre actif
    Avatar de Eric.H
    Homme Profil pro
    Inscrit en
    Décembre 2004
    Messages
    220
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Décembre 2004
    Messages : 220
    Points : 286
    Points
    286
    Par défaut
    Citation Envoyé par bambino3996
    ce qui ne serait pas le cas si il pouvait directement pointer sur le texte de mon memo
    Un memo utilise un TStrings. donc une liste de poiteur (un par ligne) pointant sur une string, donc avec le memo t'es mal !

    Faudrai plustôt voir a charger directement ton texte dans une variable AnsiString est la passer directement à RegExpr. N.B. Ne pourra fonctionne que si le texte source ne contient aucun caractere #0 (ce qui ne devrait etre le cas). A voir si c'est possible.

    Autre possibilité a tester. faire le boulot ligne par ligne, t'auras plus de code a faire, mais le RegExpr sans sortira peut etre mieux

  7. #7
    Membre à l'essai
    Profil pro
    Inscrit en
    Mai 2003
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 22
    Points : 16
    Points
    16
    Par défaut
    oui mais en ligne a ligne il pourrait il avoir des erreurs si l'expression regulière définie est sensé retourné du texte qui est sur plusieurs lignes.

    mais sinon je vais essayer ton autre solution.

    Merci en tout cas pour ton aide, je reste ouvert a d'autres propositions.
    ____@.BaMbInO.@____

  8. #8
    Expert éminent sénior

    Avatar de sjrd
    Homme Profil pro
    Directeur de projet
    Inscrit en
    Juin 2004
    Messages
    4 517
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Suisse

    Informations professionnelles :
    Activité : Directeur de projet
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2004
    Messages : 4 517
    Points : 10 152
    Points
    10 152
    Par défaut
    Citation Envoyé par Eric.H
    Citation Envoyé par sjrd
    Sais-tu seulement qu'une variable string est un pointeur ?!
    Tout dépend des options du compilateur coche "Chaine vaste"
    Avec ou sans chaînes vastes, c'est un pointeur : sans c'est un pointeur sur une zone allouée de 256 octets ; avec c'est un pointeur alloué et désalloué au fur et à mesure des besoins par le code ajouté par le compilo.

    De plus, non la chaîne n'est pas copiée à chaque fois qu'on fait une affectation. Ce qui se passe c'est qu'il y a affectation du pointeur et incrémentation du compteur de référence de cette chaîne. Lorsqu'une AnsiString est modifiée et que son compteur de référence est supérieur à 1, elle est d'abord réellement copiée en mémoire avant de se voir affecter des traitements.

    Donc le passage d'une AnsiString en paramètre non-var à une méthode est aussi rapide que le passage d'un entier, ou d'un pointeur.

    Conclusion : la transformation en PChar n'arrangera pas les choses

    En revanche, il est vrai que charger le fichier dans le mémo pour ensuite passer sa propriété Text en paramètre est une mauvaise idée. Comme l'a dit Eric.H, il vaut beaucoup mieux charger directement le fichier dans une string. Pour faire ça le plus rapidement possible, rien ne vaut les flux :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    var FileStream : TFileStream;
        StringStream : TStringStream;
    begin
      StringStream := TStringStream.Create('');
      try
        FileStream := TFileStream.Create(NomFichier, fmOpenRead or fmShareExclusive);
        try
          StringStream.CopyFrom(FileStream, 0);
        finally
          FileStream.Free;
        end;
        // utilise ici StringStream.DataString pour tes reg exp
      finally
        StringStream.Free;
      end;
    end;
    sjrd, ancien rédacteur/modérateur Delphi.
    Auteur de Scala.js, le compilateur de Scala vers JavaScript, et directeur technique du Scala Center à l'EPFL.
    Découvrez Mes tutoriels.

  9. #9
    Membre à l'essai
    Profil pro
    Inscrit en
    Mai 2003
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 22
    Points : 16
    Points
    16
    Par défaut
    ok, Merci beaucoup sjrd.

    J'ai testé et ça a l'air déjà beaucoup plus rapide dans mon traitement.

    Je pense que je vais conserver cette solution et considéré mon problème comme résolu.

    Encore Merci beaucoup aussi a tout ceux qui m'ont répondu !
    ____@.BaMbInO.@____

  10. #10
    Rédacteur


    Profil pro
    Inscrit en
    Janvier 2003
    Messages
    7 171
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2003
    Messages : 7 171
    Points : 15 060
    Points
    15 060
    Billets dans le blog
    1
    Par défaut
    Si je peux me permettre regarde si les fichiers mappés peuvent réduire les temps de traitement dans ton cas.

  11. #11
    Membre à l'essai
    Profil pro
    Inscrit en
    Mai 2003
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2003
    Messages : 22
    Points : 16
    Points
    16
    Par défaut
    ben la taille des fichiers mappés peut etre très variable et peut aller j'usqu'a faire plusieurs méga octets.

    dans ce cas je sais donc que qu'avec un fichier de cette taille les performonces seront forcément moindre. Ce que je souhaiterait tout de meme c'est d'optimiser au maximum ce traitement
    ____@.BaMbInO.@____

Discussions similaires

  1. [RegEx] Expression régulières : Balises <SCRIPT>
    Par Gwipi dans le forum Langage
    Réponses: 2
    Dernier message: 24/04/2006, 23h25
  2. Expression réguliére
    Par Mad_Max dans le forum Langages de programmation
    Réponses: 2
    Dernier message: 16/09/2003, 18h17
  3. [expression régulière] mon cerveau fait des noeuds..
    Par nawac dans le forum Algorithmes et structures de données
    Réponses: 7
    Dernier message: 27/05/2003, 10h06
  4. Expressions réguliéres
    Par Tooms dans le forum Langage
    Réponses: 4
    Dernier message: 06/12/2002, 18h42
  5. Réponses: 5
    Dernier message: 11/06/2002, 15h21

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo