Salut,
Je dois réaliser un indexer de fichier texte.
C'est à dire que pour un fichier texte, je dois en extraire tous les mots et les classer dans une base de données.
Je commence à peine et déjà je coince.
Je voudrais écrire une méthode qui permette d'extraire d'un fichier texte tous les mots pour les stocker dans un tableau.
1) J'ai pensé utiliser la méthode Split mais comme la ponctuation d'un texte ne se limite pas qu'à des points ou des virgules, cette solution ne me convient pas. (je ne tiens pas à parcourir mon fichier autant de fois qu'il y a de signes de ponctuation).
2) J'ai pensé à le faire à la main (j'ai une très bonne expérience en C mais je débute en C#) mais ça me semble pas trop correspondre à la logique dotnet.
Quelqu'un aurait-il une solution élégante à proposer ?
Merci
Partager