Salut,

J'ai un fichier multi-fasta avec beaucoup de séquences assez courtes ( > 100_000, des SNPs).

Je dois récupérer une séquence précise grâce à une expression régulière qui décrit son en-tête. (ou à défaut, avec le début de l'en-tête).

Je voulais savoir si l'un de vous connait un module qui fait ça vite.
Par vite j'entends plus vite qu'une recherche de regexp sur les en-têtes seuls.

Est-ce que Bioperl gère les très gros fichiers ?

merci,
KooK