IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

expression régulière en relation avec une liste


Sujet :

Langage Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut expression régulière en relation avec une liste
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    my @a_list_delete = qw [AY987735 AY987728 AY987737 AY987727 AY987758 AY987761];
    my $expreg = $a_list_delete[0];
    for (my $i=1; $i<@a_list_delete; $i++){
        $expreg .= '|'.$a_list_delete[$i];
    }
     
     
     
    my $in_nuc  = Bio::SeqIO->new(-file => $path.$infile_nucleotideDB, '-format' => 'Fasta');
    while ( my $seq = $in_nuc->next_seq()){
        if($seq->display_id !~ /$expreg/o){
            push (@{$h_acc{$seq->seq}}, $seq->display_id);
        }
        else{
            print "suppression de ".$seq->display_id."\n";
        }
    }
    Je dois éliminer les $seq->display_id contenant une des valeurs de @a_list_delete.

    $seq->display_id à la forme Aeromonas_caviae_AY987727, Aeromonas_hydrophila_AY987737 dont la 3ième partie peut être contenue dans @a_list_delete.

    Utiliser une expression régulière est-elle la meilleure façon de procéder?


    Merci,

  2. #2
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Vu le commentaire de Jedai
    Tu peux utiliser qr// pour stocker une regex précompilée dans une variable, c'est la meilleure option (sinon tu peux utiliser des strings normale mais la regex ne sera pas précompilée et le système d'échappement n'est pas le même que dans une vraie regex) :
    J'ai réécrit
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    #!/usr/local/bin/perl
     
    use strict;
     
    my $fichier = 'P:/Theorie/PCR_Bact_Hybridation/Sondes_en_Demis/NouveauxMarqueurs/16S/Escherichia_coli_16S_tot.fsa';
    my $motif = qr/[A-Z][a-z]+_[a-z]+[A|B]?/;
     
    if ($fichier =~ /\/($motif)_16S_tot\.fsa/){
        print "$1\n";
    }
    Est-ce mieux ainsi? Parce que dans mon cas, ce n'est pas une expression régulière qui est stockée dans ma variable mais un morceau de celle-ci ... mais je suppose que cela revient exactement au même Qu'est-ce qu'un système d'échappement? Est-ce ce que fait le programme dans le cas où il ne rencontre pas le motif?


    Merci,

  3. #3
    Expert confirmé
    Avatar de Jedai
    Homme Profil pro
    Enseignant
    Inscrit en
    Avril 2003
    Messages
    6 245
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Avril 2003
    Messages : 6 245
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Est-ce mieux ainsi? Parce que dans mon cas, ce n'est pas une expression régulière qui est stockée dans ma variable mais un morceau de celle-ci ... mais je suppose que cela revient exactement au même
    Cela revient effectivement à peu près au même, par contre tu n'obtiens pas les bénéfices de la précompilation (dans ton cas ça n'as aucune importance, ce n'est important que pour les regexps réutilisées des milliers de fois dans une boucle et qui donnent l'impression de pouvoir changer (parce qu'elles contiennent une variable) mais qui en réalité ne changent pas au cours de la boucle).

    Citation Envoyé par Jasmine80 Voir le message
    Qu'est-ce qu'un système d'échappement? Est-ce ce que fait le programme dans le cas où il ne rencontre pas le motif?
    Dans une regexp "\." n'a pas la même signification que "\." dans une string, c'est ce que je veux dire par système d'échappement, si tu essaies de mettre une regexp dans une string ordinaire tu dois te méfier de ce phénomène alors que qr// te permet d'écrire exactement comme dans une regexp.

    Par ailleurs ton problème initial ne semble pas exactement le même que celui que tu résouds dans ta réponse. J'aurais écris ton premier code comme cela :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    my @a_list_delete = qw [AY987735 AY987728 AY987737 AY987727 AY987758 AY987761];
    my $srx = join '|', map {quotemeta $_} @a_list_delete;
    my $expreg = qr/$srx/;
     
    my $in_nuc  = Bio::SeqIO->new(-file => $path.$infile_nucleotideDB, '-format' => 'Fasta');
    while ( my $seq = $in_nuc->next_seq()){
        if($seq->display_id !~ m/$expreg/){
            push (@{$h_acc{$seq->seq}}, $seq->display_id);
        }
        else{
            print "suppression de ".$seq->display_id."\n";
        }
    }
    Le quotemeta est inutile ici mais c'est une bonne habitude à prendre, et entre /o et qr//, le second est plus prévisible et clair à mon avis. C'est un besoin relativement courant, tu peux améliorer légèrement les performances avec Regexp::Assemble qui optimisera les alternatives (les transformera en un trie), cette optimisation est faite automatiquement dans la version 5.10 de Perl.

    --
    Jedaï

  4. #4
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Merci beaucoup pour ces explications.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Expression Régulières : re.sub avec une fonction
    Par Stuff90 dans le forum Général Python
    Réponses: 3
    Dernier message: 24/04/2011, 09h59
  2. [MySQL] Problème avec une liste déroulante
    Par leloup84 dans le forum SQL Procédural
    Réponses: 19
    Dernier message: 24/01/2006, 13h57
  3. Réponses: 7
    Dernier message: 24/01/2006, 12h03
  4. alligner des textbox (input) avec une liste
    Par sundjata dans le forum Balisage (X)HTML et validation W3C
    Réponses: 4
    Dernier message: 20/01/2006, 16h16
  5. Remplir 3 champs textes différents avec une liste déroulante
    Par azorol dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 20/12/2005, 01h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo