IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

Redondance base de BACends


Sujet :

Bioinformatique Perl

  1. #1
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Février 2010
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 2
    Points : 1
    Points
    1
    Par défaut Redondance base de BACends
    Bonjour,

    J'aimerais trier une banque de BES en multifasta pour enlever certaines redondances. Mais ce tri est un peu particulier: (1) je souhaiterais enlever complètement de la banque les séquences qui sont redondantes plus de 10x, car je pars de l'hypothèse que ces BES contiennent des éléments répétés du génome que je n'ai pas réussi à enlever après un premier filtre sur les bases d'éléments répétés existantes.
    (2) Sur les séquences restantes, je vais donc avoir des lots de BACends en partie redondants jusqu'à 9x, que je suppose provenir de BACs chevauchant, ou de régions dupliquées du génome. Et pour ceux ci je souhaite ne garder qu'un seul exemplaire de chaque lot, et éliminer les autres.

    Je ne peut pas utiliser un outil comme nrdb car il élimine les séquences qui sont 100% similaires, or moi je voudrais pouvoir jouer avec ce pourcentage.
    Est ce quelqu'un connaît un outil pour régler l'un de ces problèmes?

    J'étais partie pour faire un blast de la base sur elle même, et de parser ensuite les résultats en format m8, pour compter le nombre de fois qu'une séquence apparaît comme query par exemple, mais je suis bloquée là dessus, mes connaissances en perl étant encore limitées. Quelqu'un aurait il une idée?

    JulieJ

  2. #2
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Voici quelques modules qui te seront utiles :

    1) module afin de manipuler les fichiers fasta : Bio::SeqIO

    2) création d'une DB blast à partir du fichier fasta : doc
    dans la console
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    formatdb -p F -i all_seqs.fasta -n customBLASTdb
    ou en perl
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    chdir('C:/BLAST/bin');
     
    my $fasta_file = 'P:/Perl/scripts/Files/sequences.txt';
    my $blast_db = 'P:/Perl/scripts2/BLAST/StandAloneBlast/test_BlastDB';
     
     
    system "formatdb -p F -i $fasta_file -n $blast_db" or print $!;
    3) prendre les séquences 1 à 1 et les blaster en local module : Bio::Tools::Run::StandAloneBlast

    4) analyse des fichiers de sortie Blast : module Boulder::Blast



    Sinon, je sais qu'il existe des module perl afin de faire des contigs, mais je ne les ai jamais utilisés.
    -- Jasmine --

  3. #3
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Février 2010
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    Merci beaucoup, je vais voir ce que je peut faire avec ces modules.

Discussions similaires

  1. redondance listbox avec base de donnée
    Par clem44nantes dans le forum Windows Forms
    Réponses: 2
    Dernier message: 11/06/2009, 09h37
  2. problème redondant de corruption de base
    Par blank dans le forum Access
    Réponses: 8
    Dernier message: 13/03/2007, 23h41
  3. taille maximale d'une base de donnée paradox
    Par Anonymous dans le forum Paradox
    Réponses: 5
    Dernier message: 14/02/2004, 17h39
  4. sauver une base
    Par phil_java dans le forum Administration
    Réponses: 3
    Dernier message: 07/03/2003, 17h08
  5. [Concept] Stabilité d'une base de donnée
    Par lassmust dans le forum Décisions SGBD
    Réponses: 3
    Dernier message: 03/07/2002, 16h16

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo