Salut à tous.
Il y a une chose avec qui je me casse la tête.
Je cherche une manière de détecter la langue naturelle. En fait, le chose le plus important est juste si la texte est écrit en anglais ou pas. La qualité de la détection est importante.
Je suis commence par nltk et nltk stopwords. La problème est que nltk reconnaître pas les langues comme japonais, chinois, vietnamienne. Alors, quand un texte est écrit dans japonais nltk peut détecter la langue comme anglais.
Avez vous un conseil?
Partager