Bonjour,
J'ai, comme vous vous en doutez, un problème. Je dois traiter deux fichiers texte d'une taille totale de 7,5Go. Ces fichiers sont issus d'un sequenceur haut-débit, il n'y a rien que je puisse faire pour en limiter la taille. Le premier contient les sequences obtenues par le sequenceur (~2,2Go) et le deuxième les quality values pour chaques caractères de toutes les séquences du premier fichier. Mon script trie toutes les séquences pour éliminer toutes celles qui ont une quality value trop basse par rapport à un seuil defini par l'utilisateur, j'ai donc besoin des deux fichiers en même temps. Ce script marche très bien pour les petits fichiers mais j'ai une erreur out of memory dès que je passe à ses deux (énormes) fichiers. J'ai un autre script qui peut découper ce type de fichier, mais il a bien sûr le même problème. J'ai également essayé d'utiliser ultrasplitter, il me sort que mon fichier à une taille de -1. Existe-t-il un moyen pour ne pas charger la totalité de mes fichiers en même temps mais petits bouts par petits bouts?
Merci de votre aide,
Narrow
Partager