Bonjour,
J'ai fait un petit script qui me recupert le "hit" dans ma séquence d'entrée et dans la sequence de la base de donnée contre laquelle j'ai blasté; sa me genere un fichier avec les ID et les séquences restreintes au hits (pas la sequence entière).
Sa fonctionne parfaitement à une exeption près toutefois:
AKX0ABA1YP22RM1 ORSiTERT00200151 84.42 77 12 0 72 148 8465 8541 3e-08 58.0
AKX0ABA2YI17FM1 ORSiTERTOOT00031 84.69 209 29 3 97 304 225 19 4e-32 137
Ceci est un extrait de mon fichier généré par le blast sur mes séquences; la premiere ligne indique que le hit sur la sequence de l'ID ORSiTERT00200151 est entre le 8465eme nucléotide et le 8541eme, dans ce cas mon script marche.(je fait un alignement et j'observe bien la correspondance)
Dans le second cas (deuxieme ligne) le hit est dans la séquence inverse puisque le nucléotide de départ est situé plus tard que le nucléotide de fin (225-19), sa j'ai bien compris et j'ai adapté mon script pour qu'il recupert malgrès tout la sequence correspondante (départ 19 fin 225).
J'ai vérifié dans la base de donnée la sequence que je recupert est la bonne (je recupert bien la séquence du hit annoncé par le résultats du blast seulement il n'y a vraiment aucune correspondance avec ma séquence de départ malgrès les 80% d'identité annoncé (bien sur je tiens compte du fait dans mon alignement que ma séquence est inversée).
Voici mon fichier de sortie:
>AKX0ABA2YI17FM1
TCATAGACTAGCCCCACAGACCAACCCTAGTCTTTTCTGAACACTTTTGTCCTGATTTGTG
TGCACCCGGGAAGACTCCCCGATCGGTCACCCATCCTGAAATTGCTCCGGGCCAAGCACGC
TTAACCCCGAAGTTCTTTACAGGTGGGCTTCCGGAAAAGAAGGTATACGTTGGTGGTATGA
GTATTCTATCAATCCTATTAAGCCT
>ORSiTERTOOT00031 gi|33331394|gb|AF538611.1| Oryza sativa terminal-repeat retrotransposon TIM-1, complete sequence REVERSE
GCTTAATAGGATTAATAGAATACTCATATCAACAAGTTGCAACTTCTTTTCCGGAAGCCAA
TCTCCAAAGAACTCCAGGGTTAAGCGTGCTTGGCCTGGAGCAATTTGGGATGGGTGACCGA
CCGGGAAATTCTTCCCGGGTGCACACGAGTGAGGACAAAGTGTGCAGAAAAGACATGTGTT
GGTCTGTGAGGGCAGTCTATGACC
Et voici la même séquence inversé (celle qui devrait correspondre au hit)
>ORSiTERTOOT00031 gi|33331394|gb|AF538611.1| Oryza sativa terminal-repeat retrotransposon TIM-1, complete sequence REVERSE
CCAGTATCTGACGGGAGTGTCTGGTTGTGTACAGAAAAGACGTGTGAAACAGGAGTGAGCA
CACGTGGGCCCTTCTTAAAGGGCCAGCCAGTGGGTAGGGTTTAACGAGGTCCGGTTCGTGC
GAATTGGGACCTCAAGAAACCTCTAACCGAAGGCCTTTTCTTCAACGTTGAACAACTATAC
TCATAAGATAATTAGGATAATTCG
Je ne comprend pas où est l'erreur le la limite du hit du résultats de blast m'indique que le hit est "inverse" mais si je prend la sequence 19-225 dans le sens normal ou inverse on ne retrouve aucune correspondance.
Est ce que lorsque le hit est inverse (nucléotide début plus élevé que nucléotide de fin) la numérotation des nucléotide de la séquence s'applique sur la séquence normal ou sur la séquence inverse?
Je viens de tester en inversant la séquence total puis en recuperant le hit 19-225 et le résultat ne semble pas etre concluant.
Si quelque un à déjà eu ce soucis, sa serait sympa de m'éclairer
PS: je me doute que des module complémentaire doivent exister pour directement récupérer les hits mais maintenant que j'ai mon script j'aimerais au moins comprendre le fichier de sortie de blast c'est certainement un truc tout bête mais je me mélange à force d'être dessus dans les sens de lectures et compagnie...
Partager