IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

regex avec plusieurs entrées


Sujet :

Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éprouvé
    Avatar de stc074
    Homme Profil pro
    Codeur du dimanche
    Inscrit en
    Janvier 2009
    Messages
    1 015
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Lozère (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Codeur du dimanche

    Informations forums :
    Inscription : Janvier 2009
    Messages : 1 015
    Billets dans le blog
    1
    Par défaut regex avec plusieurs entrées
    Bonjour, j'utilise les regex pour transformer un code HTML <pre></pre> qui est de la forme &lt;pre... dans ma base de données :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
            pattern = Pattern.compile("&lt;pre class=&quot;(.{2,20})&quot;&gt;(.+)&lt;\\/pre&gt;", Pattern.DOTALL | Pattern.MULTILINE);
            matcher = pattern.matcher(cont);
            replace = "<pre class=\"$1\">$2</pre>";
            int j=0;
            cont = matcher.replaceAll(replace);
    si il y a 3 <pre></pre> à la suite (même séparés) java remplace la première balise <pre> d'ouverture et la dernière </pre> de fermeture, bien sur ce n'est pas satisfaisant.

    je ne vois pas trop comment faire j'ai essayé avec une boucle while(matcher.find()) mais apparemment il ne me trouve qu'un motif (alors qu'il y en a 3), j'avoue qu'après quelques recherches sur google je bloque un peu.
    Merci.

  2. #2
    Expert confirmé Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 985
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 985
    Par défaut
    C'est normal car tu utilises .+ pour décrire le contenu entre les balises ouvrante et fermante. Or les quantificateurs sont gourmands par défaut c'est à dire qu'ils vont prendre la plus grande chaîne possible. Une solution est donc d'utiliser un quantificateur non gourmand qui s'écrit ainsi: .+? (on ajoute juste un point d'interrogation pour inverser la tendance d'un quantificateur. De même, on peut écrire *?, {1,5}? ou encore ??.)

    Ces deux tendances induisent deux comportements différents pour le moteur de regex:
    • le quantificateur gourmand prend tous les caractères possible, mais si la suite de la pattern n'est pas satisfaite, le quantificateur gourmand est forcé de rendre des caractères un à un, jusqu'à ce qu'elle le soit. Ce mécanisme s'appelle le backtracking.
    • le quantificateur non-gourmand (ou paresseux) fait le contraire, il prend des caractères un à un tant que la suite de la pattern n'est pas satisfaite. Dés qu'elle l'est, il s'arrête.


    Néanmoins, pour le problème qui t'occupe, il y a une approche bien plus performante qui consiste à ne pas se préoccuper du contenu entre les balises, pour se concentrer sur les balises elles-mêmes, soit basiquement:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    s = s.replaceAll("(?i)&lt;(/?pre\\b[^&]*)&gt;", "<$1>");
    (?i) rend la pattern insensible à la casse.

    \b est un word boundary (la limite entre un caractère appartenant à la classe de caractère \w et un caractère n'y appartenant pas ou le début ou la fin de la chaîne)

    [^&] n'importe quel caractère qui n'est pas un &.

Discussions similaires

  1. [AC-2007] Concatener Champ avec plusieurs entrées
    Par le_sayan dans le forum IHM
    Réponses: 2
    Dernier message: 04/09/2013, 07h31
  2. Inputbox avec plusieurs entrées
    Par nico17137 dans le forum IHM
    Réponses: 4
    Dernier message: 21/06/2013, 17h48
  3. Form avec plusieurs entrées d'un même nom
    Par Clive40 dans le forum Langage
    Réponses: 4
    Dernier message: 18/03/2013, 17h12
  4. [AC-2007] formulaire pour une personne avec plusieurs entrées
    Par askobalt dans le forum IHM
    Réponses: 4
    Dernier message: 24/10/2012, 15h27
  5. JOptionPane avec plusieur ligne d'entrée
    Par harris_macken dans le forum AWT/Swing
    Réponses: 7
    Dernier message: 28/03/2008, 09h43

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo