IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C# Discussion :

REGEX suite d'un pattern


Sujet :

C#

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Mai 2006
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Mai 2006
    Messages : 15
    Par défaut REGEX suite d'un pattern
    Bonjour,

    Je travail en ce moment sur le décodage des header d'un e-mail (et c'est hachement prise de tête). Je suis en train de décoder les champs FROM et SUBJECT et je bloque sur un regex.

    Voici un exemple de chaîne :
    "truc avant ! =?utf-8?B?QsOpYsOpOSA=?=<truc@après.fr> "

    Voici le regex que j'utilise :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    (?<prefixe>.*?)=\?(?<encoding>.*?)\?(?<base>B|Q|b|q)\?(?<val>.*?)\?=(?<suffixe>.*?)
    Le regex marche tout bien, sauf qu'il me renvoie jamais de suffixe. Je peux me brosser pour récupérer <truc@après.fr> par exemple.

    Est ce que quelqu'un voit pourquoi ?

    Merci pour votre aide.

  2. #2
    Membre expérimenté
    Avatar de StormimOn
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2005
    Messages
    2 593
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Sarthe (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 2 593
    Par défaut
    Le suffixe étant en dernier, ça ira mieux si tu prends donc tout ce qui reste (.*) et non en forçant le moins d'éléments possibles (.*?), car cela renverra forcément 0 caractères
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    (?<prefixe>.*?)=\?(?<encoding>.*?)\?(?<base>B|Q|b|q)\?(?<val>.*?)\?=(?<suffixe>.*)

  3. #3
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Par défaut
    Je te conseille d'utiliser Expresso pour tester tes expressions régulières
    http://www.ultrapico.com/Expresso.htm

  4. #4
    Membre expérimenté
    Avatar de StormimOn
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2005
    Messages
    2 593
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Sarthe (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 2 593
    Par défaut
    Exact, j'ai oublié de le mentionner cette fois-ci ^^

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Mai 2006
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Mai 2006
    Messages : 15
    Par défaut
    Merci pour votre aide mais malheureusement je ne veux pas que mon pattern soit greedy pour le cas où il se répète. Exemple :

    "truc avant ! =?utf-8?B?QsOpYsOpOSA=?=<truc@après.fr> =?utf-8?B?QsOpYsOpOSA=?= dernier truc"

    Ajoutd'hui, j'ai effectivement pris ta solution et enlevé le ?, mais je suis alors obligé de faire une récurrence et de rappeler ma fonction pour étudier le suffixe (puisqu'il peut contenir des parties à décoder).

    Cette solution est très consommatrice de ressources, est ce que quelqu'un a une idée du pattern nécessaire ?

  6. #6
    Membre expérimenté
    Avatar de StormimOn
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2005
    Messages
    2 593
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Sarthe (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 2 593
    Par défaut
    Quel est le séparateur entre les différentes entrées ? L'espace ? L'idéal serait d'avoir une ligne par entrée.

  7. #7
    Membre averti
    Profil pro
    Inscrit en
    Mai 2006
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Mai 2006
    Messages : 15
    Par défaut
    C'est une entête d'un e-mail. D'après les rfc(je sais plus combien) il faut déplier les entêtes pour en avoir une par ligne. Donc mon fichier est comme ça :

    To: monsieur@blah.com
    FROM: =?ISO?b?GYFmGF?= madame@blah.com
    SUBJECT : Coucou mon =?UTF?b?JLNfoePe?= d'amour =?UTF?b?JLNfoePe?= que j'aime

    Il n'y a pas forcément de séparateur connu.

    Ou alors, il faut travailler avec des fonction IndexOf et Substring mais plus des Regex ^^

  8. #8
    Membre averti
    Profil pro
    Inscrit en
    Mai 2006
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Mai 2006
    Messages : 15
    Par défaut [Résolu]
    Juste pour finir ce thread (si si, je reste convaincu que quelques irréductibles souhaitaient avoir une solution à cette épineux problème, ne brisez pas mes illusions) voici comment je m'en suis sorti :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    public String Decode(String text)
    		{
     
    			String r = @"(?<prefixe>.*?)=\?(?<encoding>.*?)\?(?<base>B|Q|b|q)\?(?<val>.*?)\?=";
    			Encoding code;
    			MimeCodeQP aCode = new MimeCodeQP();
    			Base64Decoder base64;
    			String strDecoded = "";
    			byte[] temp;
    			foreach(Match m in Regex.Matches(text,r))
    			{
     
    				strDecoded += m.Groups["prefixe"].ToString();
    				if (m.Groups["base"].ToString().ToUpper().Equals("B"))
    				{
    					//décoder val de base 64
    					code = Encoding.GetEncoding(m.Groups["encoding"].ToString());
    					base64 = new Base64Decoder(m.Groups["val"].ToString().ToCharArray());
    					temp = base64.GetDecoded();
    					strDecoded += code.GetString(temp).Replace("_", " ");
    				}
    				else
    				{ 
    					aCode.Charset = m.Groups["encoding"].ToString();
    					strDecoded += aCode.DecodeToString(m.Groups["val"].ToString()).Replace("_", " ");
    				}
    			}
     
    			if ((text.LastIndexOf("?=")+2) < text.Length)
    			{
    				strDecoded += text.Substring(text.LastIndexOf("?=") + 2);
    			}
     
    			if (strDecoded.Equals(String.Empty))
    				return text;
    			else
    				return strDecoded;
    		}
    Au lieu de m'embêter à retrouver l'éventuel suffixe ou d'analyser si le suffixe contient encore des morceaux à décoder, je récupère dans une boucle (en mode GREEDY) les morceaux de chaînes <prefixe><truc à décoder> successifs et vérifie seulement à la fin s'il reste un petit bout non codé à rajouter.

    Je reste toutefois déçu de pas avoir trouvé un petit regex qui me faisait le café

  9. #9
    Membre averti
    Profil pro
    Inscrit en
    Mai 2006
    Messages
    15
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Mai 2006
    Messages : 15
    Par défaut
    Je cherche comment faire apparaître [Résolu] en début de sujet, mais je n'y arrive pas... (boulet inside ? )

  10. #10
    Membre expérimenté
    Avatar de StormimOn
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2005
    Messages
    2 593
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Sarthe (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 2 593
    Par défaut
    Bouton en bas de la page

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Pattern][Regex] vérifier que mon email est valide
    Par anitshka dans le forum Collection et Stream
    Réponses: 7
    Dernier message: 23/05/2011, 13h03
  2. [regex.Pattern] comment on active CASE_INSENSITIVE ?
    Par ramislebob dans le forum Collection et Stream
    Réponses: 2
    Dernier message: 02/08/2007, 15h16
  3. [Regex] Pattern matching
    Par jeRame dans le forum Collection et Stream
    Réponses: 1
    Dernier message: 26/06/2007, 14h28
  4. [regex] pattern pour une methode publique
    Par Invité dans le forum Collection et Stream
    Réponses: 3
    Dernier message: 17/04/2007, 12h57
  5. java regex (suite)
    Par sroux dans le forum Langage
    Réponses: 4
    Dernier message: 21/06/2006, 14h13

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo