IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

parcour d'une séquence


Sujet :

Langage Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2007
    Messages
    142
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 142
    Par défaut parcour d'une séquence
    bonjour,

    J'ai une séquence et j'aimerais connaître le nombre de N dans celle-ci.
    la position du premier N rencontré et celle du dernier N rencontré

    fichier
    >seq_1
    ATTTTNNNNNGATCA
    >seq_2
    ATTTTAAAAAAGATCA

    ce que je souhaite faire dans mon script c'est lorsque l'on rencontre un N on conserve la position et lorsque l'on rencontre le dernier N on conserve la poisition.

    Ce que je n'arrive pas à traduire c'est garder le dernier N.



    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    my $nbre =0;
    open (SEQ, "< interm") or die("Impossible de lire dans le fichier$!");
     
    while( my $ligne=<SEQ>){
        if($ligne =~ /^>(.+)$/){
    	$nbre ++; 
        }
        else{
    	if($ligne =~ /N/){
               for(my $i=1; $i<= length($ligne) ; $i++){
                    if(substr("$ligne",0,$i) =~  /N/){
                           if( substr("$ligne",0,$i+1) ne  "N"){
                                   #si la base suivante n'est pas un N, on conserve la position
    	                       my $x=$i+1;
                                   print("début: $i\tfin: $x");
    	              }	
    	       }
    	  }
          }
       }
    }

    au final j'aimerais avoir
    seq_1 \t2569 \t3520
    seq_2 \t0 \t0



    Pouvez vous m'orienter, merci

  2. #2
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 59
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Par défaut
    Je propose une méthode utilisant les listes, à travers le module List::MoreUtils:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    use List::MoreUtils qw(indexes);
     
    my $seq_name;
    foreach my $seq (<STDIN>) {
      if ($seq =~ /^>(.*)/) {
        $seq_name = $1; next;
      }
      else {
        my @N = indexes { /N/ } split //, $seq;
        ($first, $last) = ($N[0], $N[-1]);
        print join "\t", $seq_name, $first // 0, $last // 0;
        print "\n";
      }
    }
    Ce n'est sans doute pas la plus efficace.
    On obtient le nombre d'occurrences de N avec scalar(@N).

  3. #3
    Membre chevronné Avatar de Beniou
    Homme Profil pro
    Inscrit en
    Novembre 2009
    Messages
    357
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : France, Nord (Nord Pas de Calais)

    Informations forums :
    Inscription : Novembre 2009
    Messages : 357
    Par défaut
    Pour cela tu peux utiliser la fonction pos de PERL qui garde en mémoire l'emplacement dans la chaîne du dernier caractère "matché".

    Exemple pour ta boucle de lecture :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
     
    while( my $ligne=<SEQ>){
      my $current_seq;
      my $pos_debut = 0;
      my $pos_fin = 0;
     
      if($ligne =~ /^>(.+)$/){
        $current_seq = $1;
        print $current_seq."\n";
      }
      else{
        if($ligne =~ /N/){
          while($ligne =~ /(N+)/g){
    	$pos_fin = pos($ligne);
    	$pos_debut = $pos_fin - length($1) + 1;
    	print "$pos_debut\t$pos_fin\n";
          }
        }
        else{
          print "$pos_debut\t$pos_fin\n";
        }
      }
    }
    Ici on regarde si la ligne contient au moins un N : si elle en contient on va regarder tous les paquets de N (N+) qu'elle contient et afficher leurs positions : pos repère l'indice dans la chaîne du dernier N matché et on retranche la longueur des N (ici $1) pour avoir la position du premier N. Et ceci marche si ta séquence contient plusieurs paquets de N.

    La solution n'est pas optimale mais normalement elle fonctionne. A toi d'adapter la sotrtie en fonction de ce que tu veux.

    EDIT : Philou67430 propose une autre méthode, à toi de voir celle qui te paraît la plus appropriée

  4. #4
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2007
    Messages
    142
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 142
    Par défaut
    bonjour,

    merci à vous,

    Beniou comment récupérer la séquence pour avoir ceci:

    au final j'aimerais récupérer
    sequence\tpos_debut\tpos_fin

  5. #5
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2007
    Messages
    142
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 142
    Par défaut
    Désolé,

    Tout est OK. j'ai mis dans un tableau la sequence , les positions.

    Encore merci

  6. #6
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2007
    Messages
    142
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 142
    Par défaut
    J'ai un souci:
    quand ma séquence possède plusieurs fragment de N. Je bloque pour indiquer le nom de la séquence

    fichier
    >seq_1
    ATTTTNNNNNGATCANNNNN
    >seq_2
    ATTTTGTANNNN
    >seq_3
    ATTTTAAAAAAGATCA
    >seq_4
    ATTTTNNNNN

    en effet, j'obtiens:
    seq_4 6 10
    seq_1 6 10
    16 20
    seq_3 0 0
    seq_2 9 12


    alors que je voudrais que ce soit
    seq_4 6 10
    seq_1 6 10
    seq_1 16 20#avoir indiqué seq1
    seq_3 0 0
    seq_2 9 12


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    while( my $ligne=<SEQ>){
      my $current_seq;
      my $pos_debut = 0;
      my $pos_fin = 0;
     
      if($ligne =~ /^>(.+)$/){
        $current_seq = $1;
        print $current_seq."\t";
      }
      else{
        if($ligne =~ /N/){
          while($ligne =~ /(N+)/g){
    	$pos_fin = pos($ligne);
    	$pos_debut = $pos_fin - length($1) + 1;
    	print "$pos_debut\t$pos_fin\n";
          }
        }
        else{
          print "$pos_debut\t$pos_fin\n";
        }
      }
    }

    Comment trier un tableau sur une colonne?
    seq_1 6 10
    seq_1 16 20#avoir indiqué seq1
    seq_2 9 12
    seq_3 0 0
    seq_4 6 10

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. parcour d'une séquence (2)
    Par pontarose dans le forum Langage
    Réponses: 4
    Dernier message: 18/06/2010, 14h01
  2. Réponses: 4
    Dernier message: 18/10/2004, 16h18
  3. [C#] [ADO] Parcours d'une grande quantité d'enregistrements
    Par Wavyx dans le forum Windows Forms
    Réponses: 4
    Dernier message: 21/09/2004, 09h16
  4. Passer une séquence en parametre
    Par djousss dans le forum CORBA
    Réponses: 2
    Dernier message: 02/12/2003, 22h39
  5. Extraire une séquence d'un fichier MPEG
    Par enzosp dans le forum DirectX
    Réponses: 2
    Dernier message: 24/02/2003, 11h30

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo