IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

Contig séquences répétées


Sujet :

Bioinformatique Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 4
    Par défaut Contig séquences répétées
    Bonjour,

    Comme indiqué dans le titre, je souhaiterais assembler des séquences répétées (unités de quelques 100aines de pb ~, répétées en tandem).

    J'ai à disposition tout un jeu de séquences de yac que je voudrais "contiguer", et qui contiennent ce type d'information.

    J'ai cherché des logiciels (CD-Hit, CAP3), mais qui ne m'ont pas permis de réaliser cet assemblage.

    Existe-il des modules bioperl qui pourrait m'être utile, ou d'autres logiciels??

    Toute aide sera la bienvenue!

    Merci d'avance.

  2. #2
    Membre confirmé
    Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Novembre 2009
    Messages
    212
    Détails du profil
    Informations personnelles :
    Âge : 35
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Novembre 2009
    Messages : 212
    Par défaut
    je ne comprends pas vraiment ce que tu souhaites. Pourrais-tu mettre un exemple de ce que tu as et ce que tu désire comme résultat stp ?

  3. #3
    Futur Membre du Club
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 4
    Par défaut
    En fait, j'ai des données de séquençage qui correspondent à une zone contenant des séquences répétées(très peu de polymorphisme entre mes repeats), et il faudrait que je puisse réaliser un contig de cette zone, à partir des séquences que j'ai.

    Mais le problème c'est que lorsque j'essaie d'assembler mes séquences, les logiciels que j'ai mentionné, m'empilent mes séquences au lieu de les mettre bout-à-bout.

    Je n'ai mis qu'une petite partie de ce que j'obtiens en pièce jointe.
    Et donc ce que je voudrais c'est pouvoir mettre bout à bout ce type de données.

    Mais j'ai peut être une solution avec un autre logiciel qui pourrait prendre en compte ce type de données

    En espérant avoir été plus claire...

    Merci d'avance!
    Fichiers attachés Fichiers attachés

  4. #4
    Membre confirmé
    Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Novembre 2009
    Messages
    212
    Détails du profil
    Informations personnelles :
    Âge : 35
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Novembre 2009
    Messages : 212
    Par défaut
    serait-il possible que tu nous passes ce que tu donne à ton logiciel en entrée stp? et ce que tu souhaiterais obtenir.
    D'après ce que j'ai compris tu aurais en entrée diverse sequences soit:
    ATC..... Seq1
    GTC..... Seq2
    ect
    et tu voudrais en sortie :
    ATC.....Seq1GTC.....Seq2

    Si c'est cela il suffit d'un petit bout de code Perl. Sinon explique en détail un peu comme ce que j'ai fait au-dessus stp.

  5. #5
    Futur Membre du Club
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 4
    Par défaut
    Désolé pour le retard,

    En entré, j'ai ce type de séuqneces

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    seq1 : ATGATGATGATGATGATGATGATGATGATG
    seq2 : ATGATGATGATGATGATGATGATGATGATG
    Comme j'ai des séquences répétées(très peu de polymorphisme), j'obtiens ce genre de résultat
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    ATGATGATGCTGATGATGATGATGATGTTG
    ATGATGCTGATGATGATGATGATGATGATG
    ATGATGATGATGATGATGATGATGATGATG
    ATGATGATGATGATGATGATGATGATGATG
    Alors que je voudrais cela :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    ATGATGATGCTGATGATGATGATGATGTTG
          ATGCTGATGATGATGATGATGTTGATGATGATGATGATGGTG
    		  ATGATGATGTTGATGATGATGATGATGGTGATGATGATGATG
    voila,
    Merci pour votre aide!

    ============================
    Liste des logiciels testés : cd-hit, cap3
    Logiciel en cour d'essai : MIRA

  6. #6
    Membre confirmé
    Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Novembre 2009
    Messages
    212
    Détails du profil
    Informations personnelles :
    Âge : 35
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Novembre 2009
    Messages : 212
    Par défaut
    si tu as PERL d'installer sur ta machine j'ai fait un programme qui marche bien.
    Je ne sais pas non plus si tu as qq notions.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
     
    #/usr/bin/perl
     
    use strict;
    use warnings;
    use Cwd;
     
    my @tab;
    my $i;
    my $reponsebis = 0;
    my $dossier_courant= getcwd(); #donne le chemin de là ou le prog est lancé
     
    open (FILE, "$dossier_courant\\exemple.txt") || die "canot open file";#a la place de exemple mettre le nom du fichier en entrée 
    open (FILERESULT, ">>$dossier_courant\\result5.txt") || die "cannot create fileresult";
     
    print "Donner le nombre de bases\n";
    my $reponse = <STDIN>;
    chomp $reponse;
    while (<FILE>)
    {
    	my $ligne = $_;
    	chomp $ligne;
    	if ($ligne =~ /^seq\d+\s+:\s+(\D+)/)#expression reguliere a revoir selon ton fichier entrée je l'ai mise selon l'exemple que tu m'as donné
    	{
    		my $impression = $1."\n";
    		print "passe if\n";
    		for ($i=0; $i<$reponsebis; $i++)
    		{
    			print "passe\n";
    			push (@tab, " ");
    		}
    		push (@tab, $impression);
    		$reponsebis = $reponsebis+$reponse;
    		print "$reponse\n";
    	}
    }
     
    foreach (@tab)
    {
    	print FILERESULT "$_";
    }
     
    close (FILE);
    close (FILERESULT);
    Donc voila en gros sa va te demander de combien tu veux décaler dans ton cas 6 selon ton exemple et sa te met un fichier resul5 en texte avec ce que tu souhaites.
    Si tu as des question n'hésite pas

  7. #7
    Futur Membre du Club
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    4
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 4
    Par défaut
    Merci de me proposer des solutions, mais ce n'est pas exactement ce que je souhaite faire...

    Dans mon cas, je dois réaliser un contig, basé sur des séquences répétées.
    on sait que la région qui m'intéresse fait quelques 100aine de kb, mais mes résultats me donnent un contig de 2kb

    Après renseignements, il apparaitrait que MIRA soit le logiciel le plus approprié, mais mes résultats ne sont pas convaincants, bien que je fasse varier pas mal de paramètres...
    Sachant aussi que je suis entrain de me procurer la suite phred/phrap/consed pour la tester en parallèle.

    Merci encore pour vos idées!!

  8. #8
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    Bonjour,

    J'ai 2 séquences, une forward et une reverse dont j'aimerais obtenir le contig. J'ai recherché les modules pouvant m'être utiles et j'ai trouvé Bio::Tools::Run::Phrap, Bio::Tools::Alignment::Consed et Bio::Tools::dpAlign mais je n'arrive pas à les utiliser. Les premiers pourraient te servir si tu utilises Phrap et Consed.

Discussions similaires

  1. Algorithme de recherche de séquences répétées
    Par madprod dans le forum Langage
    Réponses: 3
    Dernier message: 27/11/2013, 17h06
  2. Trouver dans un texte les séquences répétées
    Par Amybond dans le forum C++
    Réponses: 15
    Dernier message: 14/03/2009, 23h58
  3. Trouver dans un texte les séquences répétées
    Par Amybond dans le forum Algorithmes et structures de données
    Réponses: 15
    Dernier message: 14/03/2009, 13h58
  4. Passer une séquence en parametre
    Par djousss dans le forum CORBA
    Réponses: 2
    Dernier message: 02/12/2003, 22h39
  5. Extraire une séquence d'un fichier MPEG
    Par enzosp dans le forum DirectX
    Réponses: 2
    Dernier message: 24/02/2003, 11h30

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo