identifier la complémentarité entre des séquences
Bonjour à tous,
J'ai des millions de séquences à analyser (taille variant entre 25 et 30 nt).
Je souhaite en fait identifier, pour chaque séquence, si il y a des sequences complémentaires à ma séquence, sachant que la complémentarité peut être sur toute la longueur de ma séquence, mais aussi bien sur les 10 premiers nucléotides, comme sur les 3 premiers, les 5 premier etc ...
Par exemple :
>seqA
UACGCAGAGGCCUAAGUAAAUAGUC
>seqB
GAAUUUCAUUUACCGGAUGCGUCUCC
Voici un exemple de complémentarité que je peux avoir :
Code:
1 2
| ----------------UACGCAGAGGCCUAAGUAAAUAGUC
GAAUUUCAUUUACCGGAUGCGUCUCC |
Je ne vois pas du tout comment m'y prendre, quelqu'un aurait une idée à me proposer ?
Merci pour votre aide!