Bonjour,
Je dois améliorer une apply qui parcourt un texte pour en dénombrer le nombre de mots et leurs occurrences (dite segmentation). J'ai donc une classe qui a pour attributs : Un String et une liste d'occurrences sous forme d'une liste de paire d'offset.
Cette classe s'appelle SEGINCONTEXTS et la classe qui contient tous les mots est SEGINCONTEXTSLIST (logique ! ).
Voilà d'un point de vue mémoire c'est performant pour des textes (.txt) ne dépassant pas les 900ko.
C'est pour ça que je voudrais savoir si quelqu'un a une idée pour que je puisse segmenter un texte de n'importe quelle taille ?
Merci d'avance![]()
Partager