Précédent   Forum du club des développeurs et IT Pro > C et C++ > C++ > Bibliothèques
Bibliothèques Forum d'entraide sur les bibliothèques C++ : installation, utilisation. Avant de poster : Cours sur les bibliothèques C++
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse
 
Outils de la discussion
Publicité
'
Vieux 25/09/2012, 17h07   #1
skeud
Membre éprouvé
 
Homme romain escudier
Développeur informatique
Inscription : juin 2011
Messages : 303
Détails du profil
Informations personnelles :
Nom : Homme romain escudier
Âge : 23
Localisation : France, Ille et Vilaine (Bretagne)

Informations professionnelles :
Activité : Développeur informatique
Secteur : High Tech - Éditeur de logiciels

Informations forums :
Inscription : juin 2011
Messages : 303
Points : 489
Points : 489
Par défaut pocketsphinx reconnaissance vocale

Bonjour a tout le monde, je suis en train de coder un petit soft de reconnaissance vocale pour un projet perso.

Pour ceux qui ne connaissent pas pocketsphinx, c'est une petite api bien pratique pour la reconnaissance vocale développée en c++.

Les tutos et exemples sont tres rares sur le web, je me suis donc debrouiller un peu par moi-meme pour traficoter un petit bout de code capable de lire un flux audio stocker de maniere brut dans un fichier.

jusque la, tout va bien, j'arrive a le lire et a le decoder avec la methode "ps_decode_raw"
et recuperer les hypothese avec ps_get_hyp.

Sule probleme, c'est que la reconnaissance fonctionne qu'a 10-20%, je cherche donc un moyen d'augmenter cette stat.

J'ai beau chercher dans la doc doxygen (tres dure a digerer) de pocketsphinx, mais je ne trouve rien.

Pourtant, quand j'utilise le petit soft disponible pocketsphinx_coninuous, la reconnaissance fonctionne a 80-90%.

Quelqu'un aurait deja bosser sur cette API et saurais me donner une petite piste? ^^
__________________
Pas de solution, pas de probleme

Une réponse utile (ou +1) le pouce vert
Une réponse à votre question

skeud est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 26/09/2012, 15h23   #2
skeud
Membre éprouvé
 
Homme romain escudier
Développeur informatique
Inscription : juin 2011
Messages : 303
Détails du profil
Informations personnelles :
Nom : Homme romain escudier
Âge : 23
Localisation : France, Ille et Vilaine (Bretagne)

Informations professionnelles :
Activité : Développeur informatique
Secteur : High Tech - Éditeur de logiciels

Informations forums :
Inscription : juin 2011
Messages : 303
Points : 489
Points : 489
Trouver!!!!!!!!

En fait il suffit juste d'utiliser OpenAl, suivre le bo tuto de dvp et modifier quelques parametre pour enregistrer au format mono avec un echantillonage a 16000 et sa fonctionne nikel

Pour ceux que sa interesse, je peux poster quelques morceaux de code pour faire de la reconnaissance vocale avec OpenAl et pocketSphinx.

Comme quoi, des fois, on trouve tout seul ^^
__________________
Pas de solution, pas de probleme

Une réponse utile (ou +1) le pouce vert
Une réponse à votre question

skeud est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/10/2012, 00h22   #3
jacen92
Invité régulier
 
Homme
Technicien Robotique & Mecatronique
Inscription : octobre 2012
Messages : 5
Détails du profil
Informations personnelles :
Sexe : Homme

Informations professionnelles :
Activité : Technicien Robotique & Mecatronique
Secteur : High Tech - Matériel informatique

Informations forums :
Inscription : octobre 2012
Messages : 5
Points : 9
Points : 9
Salut

Je trouve sa interessant, je me suis déjà cassé les dents dessus
Peut tu poster quelques exemples stp ou un descriptif de ce que tu a fais?

J'aimerai le coupler a la TTS ( pour le petite histoire )

Merci
jacen92 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Cette discussion est résolue.
Outils de la discussion

Navigation rapide


Fuseau horaire GMT +2. Il est actuellement 08h18.


 
 
 
 
Partenaires

Hébergement Web