IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bioinformatique Perl Discussion :

parsing de plusieurs fiches Ganbank


Sujet :

Bioinformatique Perl

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 5
    Par défaut parsing de plusieurs fiches Ganbank
    Bonjour,
    Je suis débutante en bioinfo et donc en programmation. Je fais actuellement un stage ou je dispose d'un fichier contenant toutes le fiches genbank de gènes d'un génome entier. Je voudrais si c'est possible récupérer automatiquement dans un autre fichier uniquement les séquences de ces gènes...En regardant un peu j'ai vu qu'il s'agissait de parser le fichier ...J'ai donc télécharger biopyton qui semblait pouvoir m'aider ms j'y arrive pas ....
    Si un emae charitable pouvais mettre fin à mes souffrances....

  2. #2
    Membre éclairé
    Avatar de MaliciaR
    Inscrit en
    Juillet 2008
    Messages
    513
    Détails du profil
    Informations personnelles :
    Âge : 43

    Informations forums :
    Inscription : Juillet 2008
    Messages : 513
    Par défaut
    Salut et bienvenue,

    BioPython est un ensemble d'outils dont il faut se servir pour faire son propre programme : il ne fait pas tout seul
    Pourrais-tu nous préciser ce que tu sais faire exactement en programmation et avec quel(s) langage(s)?
    Le tact dans l'audace c'est de savoir jusqu'où on peut aller trop loin. Cocteau
    L'abjection la plus totale, ce n'est pas de trahir, c'est de ne jamais donner un commencement de réalité à ses rêves les plus fous. M. Moreau


    Les indispensables : Les règles, , FAQ et tutos avant de poster, et !
    Traduction de Linux Device Drivers 3 : venez participer
    membre de l'April - Promouvoir et défendre les logiciels libres

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 5
    Par défaut
    Le language que je connais c'est python d'ou l'utilisation de biopython et encore avec 3 semaines de cours je suppose que je volerais pas loin....

  4. #4
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    On a la solution en bioperl, mais bon, si tu veux une solution en biopython, faudra faire un tour sur le forum python.

    Je ne redirige pas ton post au cas où tu te décide à le faire en Perl

  5. #5
    Membre éprouvé
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 45
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Par défaut
    En Perl, je sais qu'il existe le module BioGenBankParser permettant de faire ce que tu veux. Néanmoins, je ne l'ai jamais utilisé car il y a également moyen de directement récupérer un gène précis d'un génome en interrogeant GenBank et sans devoir passer par la copie de l'entièreté des informations dans un fichier de transit (module BioDBGenBank). Il existe également le module BoulderGenbank ... mais je ne l'ai jamais utilisé non plus. Bref, ce ne sont pas les modules qui manquent

  6. #6
    Membre éclairé
    Avatar de MaliciaR
    Inscrit en
    Juillet 2008
    Messages
    513
    Détails du profil
    Informations personnelles :
    Âge : 43

    Informations forums :
    Inscription : Juillet 2008
    Messages : 513
    Par défaut
    Hello, selson,

    Donne ton code en python, on verra bien ce qu'on en fait
    Le tact dans l'audace c'est de savoir jusqu'où on peut aller trop loin. Cocteau
    L'abjection la plus totale, ce n'est pas de trahir, c'est de ne jamais donner un commencement de réalité à ses rêves les plus fous. M. Moreau


    Les indispensables : Les règles, , FAQ et tutos avant de poster, et !
    Traduction de Linux Device Drivers 3 : venez participer
    membre de l'April - Promouvoir et défendre les logiciels libres

  7. #7
    Membre à l'essai
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    5
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 5
    Par défaut
    Bonjour,

    EN fait mon code il doit dans la banque genbakb me chercher des séquences de l'organisme opuntia.Jusque là no souci. Ensuite il fait une liste d'identifiants des séquences et va donc récupérer les fiches genbank. Par la suite il récupère juste les séquences et identifiant qu'il met dans un autre fichier.

    Seulement le problème est le suivant :je n'arrive a avoir que la première séquences de ma requêtes... pour les autres séquences je dois lui spécifier qu'il doit récupérer la séquences numéro X de sa recherche et donc de la liste qu'il a générer.....
    ce que j'arrive à faire quand dans la ligne 5 du code j'ecris:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
       record_gb=ncbi_dict[gi_list[x]]
    J'aimerais faire une boucle qui lirais toutes les fiches genbank qui on été trouvé et mettrais donc également toutes les séquences correspondantes dans mon second fichier.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
     
    # -*- coding: latin-1 -*-
    from Bio import GenBank
    gi_list=GenBank.search_for("opuntia AND rpl16")## identifie les séquences par leur GI##
    ncbi_dict=GenBank.NCBIDictionary('nucleotide','genbank')
    record_gb=ncbi_dict[gi_list]
    view=open('ls.txt','w')
    view.write(record_gb)## ecrit les fiches dans ls.txt##
    view.close()##ferme ls.txt#"
    from Bio import GenBank
    parser=GenBank.RecordParser()#parsing de la fiche genbank#
    road=open('ls.txt','r')
    iterator=GenBank.Iterator(road,parser)
    record_gb=iterator.next()
    style=(">")
    vini=open('adn.txt','a')
    vini.write("\n"+"\n"+style+str(record_gb.accession)+str(record_gb.organism)+"\n"+str(record_gb.sequence))
    ##ecrit les champs sequences organisme et number d'accession
    ##dans un le fichier adn.txt##
    vini.close()
    Merci d'avance.

Discussions similaires

  1. Réponses: 4
    Dernier message: 26/11/2006, 12h23
  2. Réponses: 14
    Dernier message: 06/04/2006, 15h48
  3. Réponses: 3
    Dernier message: 16/02/2006, 18h38
  4. je veus plusieur Fiche MDI dans mon application
    Par HASSANAIT dans le forum Langage
    Réponses: 18
    Dernier message: 03/11/2005, 11h51
  5. création de plusieurs fiches dans un meme formulaire...
    Par Toff !!!!! dans le forum Access
    Réponses: 3
    Dernier message: 13/10/2005, 13h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo