Bonjour a tous,
Je travaile sur les règles d'association sur les données biologiques.
Voici un exemple de mes données:
1MRVMEIRKNYQHLWKGGILLLGMLMICNVAGQLWVTVYYGVPVWKETTTTLFCASDAKGY
2MRVMEIRKNYQHLWKGGILLLGMLMICNVAGQLWVTVYYGVPVWKETTTTLFCASDAKGY
3MKVKGIRKNWQRLWKWTMLLGMLMICSATDKLWVTVYYGVPVWKEATTTLFCASDAKAY
...
9 -------------------------------- WVTVYYGVPVWKEATTTLFCASDAKAYDTEAHNVWAIHACVPTD
10 ------------------------------- WVTVYYGVPVWKEATTTLFCASDAKAYDTEAHNVWATHACVPT
10 lignes (Séquences ordonnées en fonction de temps) et la longueur d'une séquence est variable.
Ces séquences sont ordonnées à travers le temps.(l'ordre est important pour les deux dimensions). mon travail consiste a comparer les changements des symboles (les caractères) a travers les séquences pour chaque colonne.
Je n'arrive pas a trouver la structure de données appropriée pour mon problème.Sachant que après le chargement des données en mémoire, la longueur des séquences va changer après avoir supprimé certains éléments(symboles) qui sont peu fréquents.
Est ce que j'utilise deux tableux de 2 dimensions ou tableau multidimensionnel d'ArrayList de caracteres et comment les initialiser a Java.
Pouvez vous m'aider svp?.
Merci d'avance.
Partager