IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bibliothèques Discussion :

Recherche bibliothèques de reconnaissance et de synthèse vocale


Sujet :

Bibliothèques

  1. #1
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2014
    Messages
    58
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 27
    Localisation : France, Gard (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2014
    Messages : 58
    Points : 15
    Points
    15
    Par défaut Recherche bibliothèques de reconnaissance et de synthèse vocale
    Bonsoir,

    Je compte développer en C++ une application pour "discuter" avec mon Raspberry-Pi, sous cette forme:

    moi: Bonjour comment tu t'appelle ?
    R-Pi: Bonjour je m'appelle Kevin-Pi

    Enfin voila dans un premier temps, je compte faire évoluer mon projet par la suite.

    Du coup je suis à la recherche de conseils et de bibliothèques(s) de reconnaissance vocale pour le traitement de ma voix et de synthèse pour la restitution des réponses, en C++ et qui tournerait sous un environnement Linux (Debian).

    Si vous pouvez me conseiller sur le choix des bibliothèques, et si certains ont déjà fait un projet dans ce genre avec qui je pourrai discuter ?

    Merci bonne soirée

  2. #2
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2015
    Messages
    11
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Octobre 2015
    Messages : 11
    Points : 7
    Points
    7
    Par défaut
    Bonjour,

    Pour la reconnaissance vocale je ne pourrai pas t'aider, par contre pour la synthèse vocale je te conseille de regarder eSpeak qui dispose d'une API en C.

    PS : eSpeak est dans les dépots GNU/Linux.

  3. #3
    Expert éminent sénior

    Femme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juin 2007
    Messages
    5 189
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Juin 2007
    Messages : 5 189
    Points : 17 141
    Points
    17 141
    Par défaut
    la reconnaissance vocale se fait en deux temps: transcription de l'audio vers du texte, puis réaction au texte.

    La première partie se fait classiquement via un apprentissage de la voix. Un mot clé qui peut t'aider: chaine de Markov.
    La seconde, par contre, est du domaine du chatbot.
    Mes principes de bases du codeur qui veut pouvoir dormir:
    • Une variable de moins est une source d'erreur en moins.
    • Un pointeur de moins est une montagne d'erreurs en moins.
    • Un copier-coller, ça doit se justifier... Deux, c'est un de trop.
    • jamais signifie "sauf si j'ai passé trois jours à prouver que je peux".
    • La plus sotte des questions est celle qu'on ne pose pas.
    Pour faire des graphes, essayez yEd.
    le ter nel est le titre porté par un de mes personnages de jeu de rôle

  4. #4
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2014
    Messages
    58
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 27
    Localisation : France, Gard (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2014
    Messages : 58
    Points : 15
    Points
    15
    Par défaut
    Merci pour ta réponse Loulfy je vais regarder.

    Merci à toi aussi leternel, mais d'après ton message (peut etre que je me trompe) j'ai l'impression que c'est pour faire ma propre API non ? A moins que je n'ai pas une vue assez large du problème.
    Dans un premier temps je comptais plutot partir avec des API existantes, pour tout d'abord pouvoir faire des actions simples (lancer un programme, eteindre le pi). Après c'est un projet qui me tient à coeur et que je compte améliorer au fil du temps.

    D'après ce que j'ai compris de la chaine de Markov (j'ai lu rapidement) ca repose sur des probabilités c'est bien ca ?

  5. #5
    Expert éminent sénior

    Femme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juin 2007
    Messages
    5 189
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Juin 2007
    Messages : 5 189
    Points : 17 141
    Points
    17 141
    Par défaut
    Ce que je soulignais, c'est que tu as deux problèmes très distincts.

    1. Détecter une parole et en extraire le texte.
    2. exécuter une commande (à partir du texte du problème précédent)


    Je ne connais qu'une partie de la théorie sur le premier point, et encore, mes souvenirs ont plusieurs années.
    Par contre, pour le second, il s'agit soit d'utiliser un système de chatbot, soit carrément un shell (façon bash)
    Un shell transforme en effet une suite de mots en une exécution de commande.
    Mes principes de bases du codeur qui veut pouvoir dormir:
    • Une variable de moins est une source d'erreur en moins.
    • Un pointeur de moins est une montagne d'erreurs en moins.
    • Un copier-coller, ça doit se justifier... Deux, c'est un de trop.
    • jamais signifie "sauf si j'ai passé trois jours à prouver que je peux".
    • La plus sotte des questions est celle qu'on ne pose pas.
    Pour faire des graphes, essayez yEd.
    le ter nel est le titre porté par un de mes personnages de jeu de rôle

  6. #6
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2014
    Messages
    58
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 27
    Localisation : France, Gard (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2014
    Messages : 58
    Points : 15
    Points
    15
    Par défaut
    Oui pour la deuxième partie je comptais plutot utiliser la fonction system() du c++.

    J'ai pensé au début à faire une sorte de fichier de correspondance (en xml) dans lequel il y aurait des phrases et leur "reponses"
    exemple:

    comment tu t'appelle => je m'appelle Pi

    La partie reconnaissance reconnaitrait ma question "comment tu t'appelle" et la partie synthèse "lirait" la réponse.

    Mais je sais pas si c'est possible, et je me dit que c'est peu évolutif

  7. #7
    Expert éminent sénior

    Femme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juin 2007
    Messages
    5 189
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Juin 2007
    Messages : 5 189
    Points : 17 141
    Points
    17 141
    Par défaut
    C'est le principe général.

    Sauf qu'il faut une meilleure aptitude à la réponse.
    Des réponses toutes faites, ca ne te servira pas beaucoup. Tu ne pourras même pas lui demander l'heure
    Mes principes de bases du codeur qui veut pouvoir dormir:
    • Une variable de moins est une source d'erreur en moins.
    • Un pointeur de moins est une montagne d'erreurs en moins.
    • Un copier-coller, ça doit se justifier... Deux, c'est un de trop.
    • jamais signifie "sauf si j'ai passé trois jours à prouver que je peux".
    • La plus sotte des questions est celle qu'on ne pose pas.
    Pour faire des graphes, essayez yEd.
    le ter nel est le titre porté par un de mes personnages de jeu de rôle

  8. #8
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2014
    Messages
    58
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 27
    Localisation : France, Gard (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2014
    Messages : 58
    Points : 15
    Points
    15
    Par défaut
    Enfin pour l'heure il suffirait d'appeller une fonction qui retourne l'heure dans une String et la faire lire.
    Mais oui faire des réponses prédéfinis ne m'intéresse pas beaucoup (a part peut etre pour des reponses qui ne bougeront pas).

    J'aimerai enfait pouvoir appeller certaines fonctions utilitaire aussi, comme par exemple récupérer la température de ma ville ou autre avec une api météo

Discussions similaires

  1. Bibliothèque de reconnaissance vocale
    Par Badshade23 dans le forum Multimédia
    Réponses: 0
    Dernier message: 11/01/2015, 20h02
  2. Recherche logiciel de synthèse vocale
    Par zooffy dans le forum Audio
    Réponses: 0
    Dernier message: 10/12/2013, 12h26
  3. Bibliothèque de reconnaissance vocale
    Par dtrosset dans le forum API graphiques
    Réponses: 3
    Dernier message: 14/09/2009, 10h52
  4. Recherche bibliothèque complète de mathématiques
    Par Clorish dans le forum API, COM et SDKs
    Réponses: 6
    Dernier message: 23/05/2005, 21h11
  5. synthèse vocale libre et gratuite
    Par widad_pgm dans le forum Autres Logiciels
    Réponses: 3
    Dernier message: 26/04/2004, 12h58

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo