Bonjour à tous,
J'ai un problème avec la manipulation d'un fichier fasta.
Il ressemble à cela :
>pi1
ATGCGTGAAATGCAT
>pi2
TGCCCTGATAGGGACCAGTAGAC
>pi3
ATGCGTGAAATGCATA
>pi4
TGCATGACTA
>pi5
ATGCGTGAAATGCATAT
J'ai mis en gras les pi ayant la même séquence, et je souhaite garder seulement la plus longue sequence, donc mon nouveau fichier :
>pi5
ATGCGTGAAATGCATAT
>pi2
TGCCCTGATAGGGACCAGTAGAC
>pi4
TGCATGACTA
Je n'ai aucune idée de comment faire ce genre de chose, quelqu'un pourrait m'aider ?
Merci d'avance.
Partager