Bonjour a tout le monde, je suis en train de coder un petit soft de reconnaissance vocale pour un projet perso.
Pour ceux qui ne connaissent pas pocketsphinx, c'est une petite api bien pratique pour la reconnaissance vocale développée en c++.
Les tutos et exemples sont tres rares sur le web, je me suis donc debrouiller un peu par moi-meme pour traficoter un petit bout de code capable de lire un flux audio stocker de maniere brut dans un fichier.
jusque la, tout va bien, j'arrive a le lire et a le decoder avec la methode "ps_decode_raw"
et recuperer les hypothese avec ps_get_hyp.
Sule probleme, c'est que la reconnaissance fonctionne qu'a 10-20%, je cherche donc un moyen d'augmenter cette stat.
J'ai beau chercher dans la doc doxygen (tres dure a digerer) de pocketsphinx, mais je ne trouve rien.
Pourtant, quand j'utilise le petit soft disponible pocketsphinx_coninuous, la reconnaissance fonctionne a 80-90%.
Quelqu'un aurait deja bosser sur cette API et saurais me donner une petite piste? ^^
Partager