Salut,
J'ai un fichier multi-fasta avec beaucoup de séquences assez courtes ( > 100_000, des SNPs).
Je dois récupérer une séquence précise grâce à une expression régulière qui décrit son en-tête. (ou à défaut, avec le début de l'en-tête).
Je voulais savoir si l'un de vous connait un module qui fait ça vite.
Par vite j'entends plus vite qu'une recherche de regexp sur les en-têtes seuls.
Est-ce que Bioperl gère les très gros fichiers ?
merci,
KooK
Partager