IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

REGEX


Sujet :

C

  1. #1
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Septembre 2003
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2003
    Messages : 30
    Points : 34
    Points
    34
    Par défaut REGEX
    Bonjour,

    Je veux utiliser une "expression régulière" pour extraire des sous-parties d'une chaîne de caractères et ceci en C.

    Je me suis inspiré du tutoriel présent sur le site (http://nicolasj.developpez.com/articles/regex/).

    J'ai pris une chaîne simple pour être sur de ne pas me planter sur ma regexp (elle marche bien en perl)

    chaine = "20a21a22";
    regexp = "([0-9]{2})a([0-9]{2})a([0-9]{2})";

    Je voudrais avoir :
    chaine 0 = 20
    chaine 1 = 21
    chaine 2 = 22

    J'obtiens :
    chaine 0 = 20a21a211
    chaine 1 = 20
    chaine 2 = 21

    Code ci-dessous. Merci pour votre aide.


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
     
     
    #include <stdio.h>
    #include <stdlib.h>
    #include <string.h>
    #include <regex.h>
     
    int main (void)
    {
       int err;
       int i=0;
       regex_t preg;
       const char *str_request = "20a21a22";
       const char *str_regex = "([0-9]{2})a([0-9]{2})a([0-9]{2})";
     
    /* (1) */
       err = regcomp (&preg, str_regex, REG_EXTENDED);
       if (err == 0)
       {
          int match;
          size_t nmatch = 0;
          regmatch_t *pmatch = NULL;
     
          nmatch = preg.re_nsub;
          pmatch = calloc (sizeof (*pmatch),nmatch);
          if (pmatch)
          {
    /* (2) */
             match = regexec (&preg, str_request, nmatch, pmatch, REG_NOTBOL);
    /* (3) */
             printf ("nmatch=%d \n",nmatch);
             regfree (&preg);
    /* (4) */
             if (match == 0)
             {
                 for (i=0;i<nmatch;i++) {
                char *site = NULL;
                int start = pmatch[i].rm_so;
                int end = pmatch[i].rm_eo;
                size_t size = end - start;
     
                site = calloc (sizeof (*site),(size + 1));
                if (site)
                {
                   strncpy (site, &str_request[start], size);
                   printf ("Chaine %d : %s\n", i,site);
                }
                free(site);
                 }
             }
    /* (5) */
             else if (match == REG_NOMATCH)
             {
                printf ("No match\n", str_request);
             }
    /* (6) */
             else
             {
                char *text;
                size_t size;
     
    /* (7) */
                size = regerror (err, &preg, NULL, 0);
                text = malloc (sizeof (*text) * size);
                if (text)
                {
    /* (8) */
                   regerror (err, &preg, text, size);
                   fprintf (stderr, "%s\n", text);
                   free (text);
                }
                else
                {
                   fprintf (stderr, "Memoire insuffisante\n");
                   exit (EXIT_FAILURE);
                }
             }
          }
          else
          {
             fprintf (stderr, "Memoire insuffisante\n");
             exit (EXIT_FAILURE);
          }
       }
       puts ("\nPress any key\n");
    /* Dev-cpp */
       getchar ();
       return (EXIT_SUCCESS);
    }

  2. #2
    Membre habitué Avatar de BigNic
    Profil pro
    Inscrit en
    Décembre 2004
    Messages
    195
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Décembre 2004
    Messages : 195
    Points : 154
    Points
    154
    Par défaut
    et quel est le problème ?
    ça compile pas ?
    ça crash ?
    ça prend trop de mémoire ?
    ça prend trop de temps à l'éxecussion ?
    ...

  3. #3
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Septembre 2003
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2003
    Messages : 30
    Points : 34
    Points
    34
    Par défaut
    comme indiqué ci-dessus :

    A partir de la chaine suivante "20a21a22" et en utilisant l'expression suivante ([0-9]{2})a([0-9]{2})a([0-9]{2}), je voudrais avoir :
    chaine 0 = 20
    chaine 1 = 21
    chaine 2 = 22

    Malheureusement, j'obtiens :
    chaine 0 = 20a21a211
    chaine 1 = 20
    chaine 2 = 21

    De quelle manière dois-je modifier mon code pour que mes souhaits correspondent avec la réalité ?

  4. #4
    Modérateur
    Avatar de gangsoleil
    Homme Profil pro
    Manager / Cyber Sécurité
    Inscrit en
    Mai 2004
    Messages
    10 150
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Savoie (Rhône Alpes)

    Informations professionnelles :
    Activité : Manager / Cyber Sécurité

    Informations forums :
    Inscription : Mai 2004
    Messages : 10 150
    Points : 28 119
    Points
    28 119
    Par défaut
    Bonjour,

    Je sais que cela ne répond pas directement à la question posée, mais pourquoi ne pas faire un sscanf directement sur ta chaîne ?

    Sinon, pour répondre à la question, le comportement est tout à fait normal !!

    Voici ce que j'ai sur regexec :

    Offsets in pmatch[0] identify the substring that
    corresponds to the entire regular expression.
    Donc l'affichage de chaine[0] est bien la chaine entière, ce que tu obtiens ! Si tu veux tes 3 valeurs séparées, essaye d'afficher chaine[1] à chaine[3] (attention, je n'ai pas vérifié le code, donc je ne sais pas ni si cette case est remplie, ni même si "chaine" est suffisamment grand).
    "La route est longue, mais le chemin est libre" -- https://framasoft.org/
    Les règles du forum

  5. #5
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Septembre 2003
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2003
    Messages : 30
    Points : 34
    Points
    34
    Par défaut
    Au moins j'ai une partie de la réponse : il faut que j'apprenne à lire.

    Je ne peux pas faire de chaine[3], le programme me dit que seulement 3 substrings sont ramenés. Je risque un dépassement de tampon.

    J'ai du oublier une option. la recherche continue.

    EDIT : La lecture apporte vraiment beaucoup.

    The regexec() function must fill in all nmatch elements of pmatch, where nmatch and pmatch are supplied by the application, even if some elements of pmatch do not correspond to subexpressions in pattern. The application writer should note that there is probably no reason for using a value of nmatch that is larger than preg-> re_nsub+1.
    Bien que ca ne soit pas explicite j'en ai conclu que nmatch=preg-> re_nsub+1;

    Et ça marche !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Regex] Plusieurs motifs
    Par sissi_l dans le forum Collection et Stream
    Réponses: 3
    Dernier message: 29/06/2004, 14h15
  2. [jakarta][regex]Matcher mot en entier.
    Par thibaut dans le forum Collection et Stream
    Réponses: 6
    Dernier message: 26/05/2004, 13h33
  3. [Regex] Vérifier qu'une chaîne respecte une expression régulière
    Par PeteMitchell dans le forum Collection et Stream
    Réponses: 7
    Dernier message: 13/05/2004, 14h22
  4. [regex][string] replaceAll bogué ?
    Par 7eme dans le forum Collection et Stream
    Réponses: 4
    Dernier message: 13/11/2003, 16h36
  5. Cherche regex...
    Par laurent_h dans le forum C
    Réponses: 4
    Dernier message: 31/03/2003, 11h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo