-
TALN et chatterbot
bonsoir,
j'espère que ce message sera vu par un expert du TALN et qu'il pourra y répondre ou au pire me donner des liens.
Je travaille sur un programme autour du TALN pour mettre en place un chatterbot.
L'objectif est que suite à une question le programme reconnaisse le contexte et réponde par rapport à ses connaissances quand cela est possible.
La base de connaissance étant alimentée en permanence par les discussions avec l'humain ou par la mise à disposition de texte, channel irc.
Pour cela je pense qu'il faut que je passe par ces étapes (merci de corriger, ordonnancer et/ou compléter les actions suivantes ):
- découper le texte en paragraphes, phrases, mots (tokenisation)
- lemmatisation
- racinisation
- taggage (part of speech)
- utilisation d'un moteur d'inférence pour répondre
Je pense et j'espère qu'il ne faut pas utiliser d'ontologie car cela devrait se faire manuellement
Je pense orienter mon projet sur le langage python :
- au niveau des programmes que j'ai pu trouver (
-- Racinisateur de Paice/Husk (pour gérer le français)
-- treetagger
-- ntlk
Je suis preneur de toutes les remarques, liens, documents, ...
Merci
-
salut j'aurai quelques tips pour toi si tu es toujours sur le sujet
-