IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Utilisation de "split" avec un cas particulier


Sujet :

Langage Perl

  1. #1
    Membre régulier
    Inscrit en
    Avril 2007
    Messages
    161
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 161
    Points : 101
    Points
    101
    Par défaut Utilisation de "split" avec un cas particulier
    Bonjour,

    Voila, j'utilise la fonction "split", afin d' éclater une chaîne de caractère en sous parties, et la placer dans un tableau.

    Voici un exemple de l'utilisation que j'en fais :


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    $prog = separator($), computing(select col2 from where col1 like '$1' or col2 like '$2'), getconnexion(), execution()
    my @funcs=split(/[;:]{1,}/, $prog);
    On obtient donc, avec l'utilisation de "split", les éléments suivants dans le tableau, grâce au séparateur ",":

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    separator($)
    computing(select col2 from where col1 like '$1' or col2 like '$2')
    getconnexion()
    execution()
    Le fait que ma ligne traitée contienne une requête SQL est important pour la suite.
    En effet, si ma requête est du style :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    insert into table1 (col1,col2,col3,col4) values ('$1','$2','$3','$4')
    On remarque que la requête contient des "," causant ainsi des soucis dans l'utilisation actuelle que je fais de la fonction "split".

    J'ai remarqué que pour m'en sortir, en gardant la possibilité de garder la "," comme séparateur (je n'ai pas le choix, je dois la conserver en tant que séparateur pour des raisons qui n'ont rien à voir ici), il faudrait que la "," fasse bien ofice de séparateur dans le "split", sauf si elle est contenue dans des parenthèses ...

    Avez-vous une idée pour modifier mon code, de manière à ce que la virgule serve de séparateur, à condition qu'elle ne soit pas contenue entre des parenthèses ?

    Merci pour votre aide.


  2. #2
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Dans ton exemple les virgules sur lesquelles spliter sont suivies d'un espace et les virgules de la requête dont on ne doit pas tenir compte ne le sont pas ... est-ce un hasard?

    Si non, tu peux utiliser
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    my $prog = q{separator($), computing(col1,col2,col3,col4) values ('$1','$2','$3','$4')), getconnexion(), execution()};
    my @funcs   = split /,\s/, $prog;
    map {print "$_\n";} @funcs;
    Ce qui récupère bien
    separator($)
    computing(col1,col2,col3,col4) values ('$1','$2','$3','$4'))
    getconnexion()
    execution()
    Une autre possibilité est d'utiliser une RegExp plus complexe
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my @funcs  =  $prog =~ m/.../;
    -- Jasmine --

  3. #3
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Une idée pour l'extraction par une expression régulière est de se pencher sur la récursivité introduite dans perl 5.10.
    Je n'ai pas encore réussi à écrire l'expression régulière, mais l'exemple donné dans le manuel perlre à la rubrique " "(?PARNO)" "(?-PARNO)" "(?+PARNO)" "(?R)" "(?0)" " est sans doute une bonne base.

    En gros, ce que l'on veut matcher est quelque chose comme :
    - soit une suite de caractères hormis ( et )
    - soit une suite de caractères (ou un motif tel que défini ici-même) entourés de ( et )
    et ce, autant de fois que possible, le tout suivi d'une virgule ou de la fin de chaine

    Là où j'en suis, et qui ne fonctionne pas :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    my $chaine=q{separator($), computing(col1,col2,col3,col4) values ('$1','$2','$3','$4')), getconnexion(), execution()};
     
    push @chaines, $1 while $chaine =~ /( (?: [^()]+ | ( \( (?: (?> [^()]+ ) | (?2) )+ ) \) )* ) (?: \s*,\s* | $ )/gx;
     
    print join "\n",@chaines
    qui produit :

    separator($)
    col1,col2,col3
    "$1","$2","$3"
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  4. #4
    Membre régulier
    Inscrit en
    Avril 2007
    Messages
    161
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 161
    Points : 101
    Points
    101
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Dans ton exemple les virgules sur lesquelles spliter sont suivies d'un espace et les virgules de la requête dont on ne doit pas tenir compte ne le sont pas ... est-ce un hasard?

    Si non, tu peux utiliser
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    my $prog = q{separator($), computing(col1,col2,col3,col4) values ('$1','$2','$3','$4')), getconnexion(), execution()};
    my @funcs   = split /,\s/, $prog;
    map {print "$_\n";} @funcs;
    Ce qui récupère bien


    Une autre possibilité est d'utiliser une RegExp plus complexe
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    my @funcs  =  $prog =~ m/.../;
    Concernant les espaces présents ou pas après les virgules splittantes et les autres, c'est juste que j'écris ma ligne ainsi, mais ils peuvent ne pas être présents, ce n'est pas un hasard, c'est juste que j'ai écrit de cette manière pour être clair, mais ça peut être écrit sans espace.

    Mais pourquoi pas ne pas exploiter ces espaces pour faire mon traitement? Je vais voir si je peux.

    Je voudrais éviter d'en arriver à une RegExp de la mort qui tue, même si je vais peut-être devoir m'acheminer vers là ...



    Citation Envoyé par Philou67430 Voir le message
    Une idée pour l'extraction par une expression régulière est de se pencher sur la récursivité introduite dans perl 5.10.
    Je n'ai pas encore réussi à écrire l'expression régulière, mais l'exemple donné dans le manuel perlre à la rubrique " "(?PARNO)" "(?-PARNO)" "(?+PARNO)" "(?R)" "(?0)" " est sans doute une bonne base.

    En gros, ce que l'on veut matcher est quelque chose comme :
    - soit une suite de caractères hormis ( et )
    - soit une suite de caractères (ou un motif tel que défini ici-même) entourés de ( et )
    et ce, autant de fois que possible, le tout suivi d'une virgule ou de la fin de chaine

    Là où j'en suis, et qui ne fonctionne pas :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    my $chaine=q{separator($), computing(col1,col2,col3,col4) values ('$1','$2','$3','$4')), getconnexion(), execution()};
     
    push @chaines, $1 while $chaine =~ /( (?: [^()]+ | ( \( (?: (?> [^()]+ ) | (?2) )+ ) \) )* ) (?: \s*,\s* | $ )/gx;
     
    print join "\n",@chaines
    qui produit :

    separator($)
    col1,col2,col3
    "$1","$2","$3"
    Je vais aller lire cette partie du manuel, et travailler sur l'amorce (c'est bien plus que ça en fait) de RegExp que tu as proposé.

    Je vous tiens au courant de mon avancée sur le sujet !!

    Merci à vous.

  5. #5
    Membre régulier
    Inscrit en
    Avril 2007
    Messages
    161
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 161
    Points : 101
    Points
    101
    Par défaut
    Je n'arrive à rien, j'ai beaucoup de mal avec la complexité du code proposé par Philou, je n'en suis pas à ce niveau ...

    Quelqu'un à une idée, Philou peut-être?

    Si je n'ai pas de solutions, il faudra que je créé un algo qui matchera les virgules à condition qu'elles ne soient pas entre des parenthèses, avec un compteur pour le nombre de parenthèse, enfin une usine à gaz ...

    D'avance, merci.

  6. #6
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    my $prog = q{separator($), computing(col1,col2,col3,col4) values ('$1','$2','$3','$4'), getconnexion(), execution()};
    my @funcs = $prog =~ m/(\w+\s?\(.*?\)),?/g;
    map {print "$_\n";} @funcs;
    -- Jasmine --

  7. #7
    Membre régulier
    Inscrit en
    Avril 2007
    Messages
    161
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 161
    Points : 101
    Points
    101
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    my $prog = q{separator($), computing(col1,col2,col3,col4) values ('$1','$2','$3','$4'), getconnexion(), execution()};
    my @funcs = $prog =~ m/(\w+\s?\(.*?\)),?/g;
    map {print "$_\n";} @funcs;
    Coucou Jasmine,

    D'abord, merci pour ta proposition,

    J'ai essayé le code, et j'obtiens ceci :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    separator($)
    computing(col1,col2,col3,col4)
    values ('$1','$2','$3','$4')
    getconnexion()
    execution()
    Hors, il faudrait que j'ai :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    separator($)
    computing(col1,col2,col3,col4) values ('$1','$2','$3','$4'))
    getconnexion()
    execution()
    En effet, il faut utiliser la virgule comme séparateur, sauf si elle est entre parenthèse, y compris si il y a plusieurs parenthèses imbriquées, comme justement dans l'exemple ci-dessus.

    J'ajoute qu'il peut très n'y avoir aussi aucune parenthèse dans l'expression à traiter ....

    Si tu as une alternative un peu plus poussée, je suis preneur

  8. #8
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Bah... le code que j'ai proposé me dépasse aussi C'est sans doute pour cela qu'il ne fonctionne pas.
    Je recherche ...
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  9. #9
    Membre régulier
    Inscrit en
    Avril 2007
    Messages
    161
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 161
    Points : 101
    Points
    101
    Par défaut
    Citation Envoyé par Philou67430 Voir le message
    Bah... le code que j'ai proposé me dépasse aussi C'est sans doute pour cela qu'il ne fonctionne pas.
    Je recherche ...
    J'avais réussi à le faire fonctionner partiellement en remplaçant "?2" par "?:", mais c'était encore éloigné du résultat espéré.

  10. #10
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    As-tu toujours les valeurs clés : separator, computing-values, getconnexion et execution?

    Si oui, c'est simple écris une regexp qui contient ces mots clés sans te casser la tête à vouloir être général.
    -- Jasmine --

  11. #11
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Bon, j'ai compris pourquoi mon test ne marchait pas... c'est à cause d'une erreur dans la chaine que j'avais fournie en entrée (une parenthèse fermante en trop).

    Pour séparer en différentes chaines, et en prenant pour hypothèse qu'il n'existe par de parenthèses imbriquées, voici le code à utiliser :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    my $chaine=q{separator($), computing(col1,col2,col3,col4) values ('$1','$2','$3','$4'), getconnexion(), execution()};
     
    push @chaines, $1 while $chaine =~ /( (?: [^()]+ | \( [^()]* \) )+? ) (?: \s*,\s* | $ )/gx;
     
    print join "\n",@chaines
    Ce qui produit :
    [separator($)]
    [computing(col1,col2,col3,col4) values ("$1","$2","$3","$4")]
    [getconnexion()]
    [execution()]

    Je ré-essaye avec la récursivité...
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  12. #12
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Avec la récursivité :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    my $a=q{separator($), computing(col1(10,20),col2,col3,col4) values ("$1","$2","$3","$4"), getconnexion(), execution()};
     
    push @a, $1 while $a =~ /( (?: [^()]+ | ( \( (?: (?> [^()]+ ) | (?2) )*? \) ) )+? ) (?: \s*,\s* | $ )/gx;
     
    print join "\n", map "[$_]", @a;
    Produit :
    [separator($)]
    [computing(col1(10,20),col2,col3,col4) values ("$1","$2","$3","$4")]
    [getconnexion()]
    [execution()]
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  13. #13
    Membre régulier
    Inscrit en
    Avril 2007
    Messages
    161
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 161
    Points : 101
    Points
    101
    Par défaut
    Citation Envoyé par Philou67430 Voir le message
    Avec la récursivité :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    my $a=q{separator($), computing(col1(10,20),col2,col3,col4) values ("$1","$2","$3","$4"), getconnexion(), execution()};
     
    push @a, $1 while $a =~ /( (?: [^()]+ | ( \( (?: (?> [^()]+ ) | (?2) )*? \) ) )+? ) (?: \s*,\s* | $ )/gx;
     
    print join "\n", map "[$_]", @a;
    Produit :
    [separator($)]
    [computing(col1(10,20),col2,col3,col4) values ("$1","$2","$3","$4")]
    [getconnexion()]
    [execution()]
    J'ai repris scrupuleusement ce code dans un test.pl, apparemment, j'ai un souci avec "?2", il me sort une erreur du genre :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Sequence (?2...) not recognized in regex; marked by <-- HERE in m/( (?: [^()]+ | ( \( (?: (?> [^()]+ ) | (?2 <-- HERE ) )*? \) ) )+? ) (?: \s*,\s* | $ )/ at ./test.pl line 9.
    Aurais-je omis quelque chose?


    @Jasmine : effectivement, on pourrait peut-être partir ainsi, mais rien ne dit que d'autres fonctions ne seront pas appelées dans des versions ultérieures du code, obligeant du coup à modifier à nouveau la RegExp en même temps que l'ajout des fonctions.



    EDIT :

    Voici une version pas optimisée du tout de ce que je voudrais synthétiser sous la forme d'une RegExp, comme vous m'aidez à le faire dans ce topic :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    while (my $l = <F>){
     
            my @file = split(//,$l);
            my $count = 0;
            my $var;
     
            foreach my $f( @file ) {
     
                    $count ++ if($f =~ /\(/);
     
                    $count -- if($f =~ /\)/);
     
                    if ($f =~ /[,]/ && $count == 0) {
                            push @function, $var;
                            $var = undef;
                    }
     
                    else {
                            $var .= $f;
                    }
            }
            push @function, $var;
    }
    Je lis un fichier de configuration comprenant plusieurs expressions telles que celle que je veux décomposer depuis le depuis du sujet.

    Ici, pour m'en sortir, je compte les parenthèses ouvrantes, et les parenthèses fermantes, et je prends en compte les virgules que je rencontre seulement si la différence "parenthèses fermantes - parenthèses fermantes = 0" quand on tombe sur une virgule

    On a fait ça avec mon collègue, en attendant de trouver, ou qu'on nous aide à trouver la RegExp tricky de la mort ...

    Voila.

    Mais on espère faire plus court, et plus optimisé grâce à vous

  14. #14
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Tu n'as sans doute pas la version 5.10 de perl qui introduit les expressions récursives. Tu dois donc utiliser la version que j'ai donné précédemment, ou installer la version 5.10 de perl.
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

  15. #15
    Membre régulier
    Inscrit en
    Avril 2007
    Messages
    161
    Détails du profil
    Informations forums :
    Inscription : Avril 2007
    Messages : 161
    Points : 101
    Points
    101
    Par défaut
    Banco, on est en 5.8, voire en 5.6, et je n'ai pas la possibilité d'upgrader, ce n'est pas de mon ressort.

  16. #16
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Dans ce cas, utilise la regexp de mon message #11.
    Plus j'apprends, et plus je mesure mon ignorance (philou67430)
    Toute technologie suffisamment avancée est indiscernable d'un script Perl (Llama book)
    Partagez vos problèmes pour que l'on partage ensemble nos solutions : je ne réponds pas aux questions techniques par message privé
    Si c'est utile, say

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo