Performance de découpage d'un texte
Bonjour,
Je dois améliorer une apply qui parcourt un texte pour en dénombrer le nombre de mots et leurs occurrences (dite segmentation). J'ai donc une classe qui a pour attributs : Un String et une liste d'occurrences sous forme d'une liste de paire d'offset.
Cette classe s'appelle SEGINCONTEXTS et la classe qui contient tous les mots est SEGINCONTEXTSLIST (logique ! ).
Voilà d'un point de vue mémoire c'est performant pour des textes (.txt) ne dépassant pas les 900ko.
C'est pour ça que je voudrais savoir si quelqu'un a une idée pour que je puisse segmenter un texte de n'importe quelle taille ?
Merci d'avance :)