Bonjour,
Je travaille actuellement en TAL avec une langue orientale et j'aimerais utiliser NLTK.
Après avoir lu les différents tutoriels sur le net, je ne comprends toujours pas comment on peut charger un nouveau dictionnaire pour tokenizer. J'ai un fichier .dic avec plusieurs centaines d'entrées. Ceux qui sont implémentés dans NLTK sont utilisés via un "import" (comme par exemple wordnet).

Si vous pouvez m'expliquer la manip, je suis preneur.
Merci par avance de votre aide.