Bonjour,
Je travail actuellement sur un projet de bioinformatique m'amenant à traiter de grandes quantité de données en rapport avec l'ADN.
J'ai donc besoin de stocker des séquences de caractères utilisant un alphabet de 4 lettres (A,C,G ou T, les 4 différentes nucléotides d'un brin d'ADN).
J'ai lu a plusieurs reprises qu'il était possible de les stocker avec 2 bits ( 00, 01, 11, 10 ) or le type qui prend le moins de place en Java, c'est le Byte (8 bits). J'ai été faire un tour sur BioJava mais leur système de séquence d'ADN utilise plus de place pour stocker un caractère qu'un Char en Java ...
Une idée peut-être ?
Au passage, j'ai cherché aussi mais si vous connaissez des HashMap ou HashSet optimisé pour les grandes quantité de donnée, je suis preneur
Merci à vous.
Bonne soirée
Partager