Re bonjour à tout le monde,
j'ai un fichier multifasta et je veux récupérer le tout pour l'insérer dans ma base de données et notamment la table transcript!
Ce fichier contient l'identifiant et la description du transcrit suivi de sa séquence! (il ya à peu près 35000 transcrits dans ce fichier).
Donc je voudrais un peu d'aide pour écrire un script pour pouvoir récupérer l'identifiant dans le champs identifiant, la description dans le champs description, et la séquence dans le champs séquence! Pour vs donner une petite idée du fichier fasta, voilà un exemple de son contenu pour un trancrit :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
 
>gi|124249439|ref|NM_001080875.1| Gallus gallus succinate dehydrogenase Ip (SDHB), mRNA
AATTCCACTAGTTACGCGACCCCCGGAACCCAAAGACTTGGGTTTCCCGGGAGCTGCCCCGGTACGGCTC
ATGAGTGGAGGACGTCATCAGCGGTGATGATTACTCGAATGGGGGATTCTATGGGGATTACAATGCGATG
GTCGACCAAAATGGCGGCGGCCGTGGTGGGAGTCTCCTTGAGGCGCGGCGTCCCCGCGCGGTTCCTGAGG
GCTGGGCTGCGGCCGGTGAGGGGACTGGAGGCGGTCCACGGGATCTGTCGAGGAGCTCAGACGGCGGCTG
CAGCTACATCACGTATCAAGAAGTTTTCCATCTACAGATGGGATCCTGATAAGCCTGGGGACAAGCCCCG
CATGCAGACCTATGAAGTGGATTTAAATAAATGTGGGCCTATGGTACTTGATGCTCTGATTAAGATTAAA
AACGAGTTGGACTCCACTCTGACCTTCCGCAGGTCATGCAGGGAAGGCATCTGTGGCTCCTGTGCAATGA
ACATTGCTGGTGGAAACACCCTGGCTTGTACTAAAAAAATTGACCCTGATCTCAGCAAGACCACTAAAAT
CTACCCTCTCCCCCACATGTATGTGGTGAAGGATCTCGTTCCAGACTTGAGTAACTTCTACGCACAGTAC
AAATCCATCGAGCCTTACCTGAAGAAGAAGGACGAGTCGAAACAGGGCAAGGAGCAGTACTTGCAATCCA
TAGAAGACCGTCAGAAACTGGACGGACTCTATGAGTGCATCCTCTGTGCCTGCTGCAGCACCAGCTGTCC
CAGTTACTGGTGGAATGGGGACAAGTACTTGGGTCCTGCTGTACTCATGCAGGCCTATCGCTGGATGATC
GACTCCAGAGATGACTACACAGAGGAACGCCTGGCACAACTTCAAGACCCATTTTCTCTCTACCGTTGTC
ACACTATCATGAACTGCACAAGGACTTGCCCAAAGGGTTTGAACCCTGGCAAAGCAATTGCTGAGATCAA
GAAGATGATGGCAACTTACAAAGAGAAGGCAGCCGCTGCATAATGCTGTTCCCCGACTGGAAATGTAACA
CACAAACATGCTTTACCTGGAAGTAACCTGCACTTGATTACACCTGGTTCCAGCAGGAATGTTGGTGTTT
TTCCCATATGCTTGTGTGTACAATAAATGCTGTAAAGAACAAAAAAAA
Merci