IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

Apprentissage et reconnaissance de la parole en C++


Sujet :

C++

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre à l'essai
    Inscrit en
    Mai 2005
    Messages
    6
    Détails du profil
    Informations forums :
    Inscription : Mai 2005
    Messages : 6
    Par défaut Apprentissage et reconnaissance de la parole en C++
    Voici un site que j'ai créé sur un logiciel d'APprentissage et de REconnaissance de parole, il s'appelle APREPA.
    http://membres.lycos.fr/persoac/index.html
    J'attends vos réactions...

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Février 2005
    Messages
    80
    Détails du profil
    Informations personnelles :
    Âge : 36
    Localisation : France

    Informations forums :
    Inscription : Février 2005
    Messages : 80
    Par défaut
    Je trouve le site pas mal, tu as l'aire de bien détallé ton projet, il te reste a compéter quelques blanc et ca sera bon. J'ai habitude des sites web donc je nbe parlerais pas de la mise en forme.

  3. #3
    Invité
    Invité(e)
    Par défaut
    Tres interessant

  4. #4
    Membre à l'essai
    Inscrit en
    Mai 2005
    Messages
    6
    Détails du profil
    Informations forums :
    Inscription : Mai 2005
    Messages : 6
    Par défaut
    Il me reste encore pas mal de boulot sur le site mais j'avance petit à petit...
    Il faut dire aussi que c'est pas la partie la plus passionnante et que c'est mon premier site (donc je rame...).
    Pour bien tous comprendre du projet avec ce qu'il y a sur le site c'est pas évidant mais normalement le code est bien commenté et pour peut qu'on connaisse un peut les modèles de Markov y à pas de pb ;-)

    Quelqu'un a testé ?
    Ou regardé le source (personne ne l'a encore vu donc je suis preneur de 2 3 remarques)

  5. #5
    Expert confirmé
    Avatar de Luc Hermitte
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2003
    Messages
    5 296
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Août 2003
    Messages : 5 296
    Par défaut
    En vrac. Des remarques techniques, je n'ai pas regardé la partie MMC et reco de parole, mes souvenirs sur le sujet, sont tout juste des souvenirs, bien trop lointains.

    - Arg! Lycos et ses bannières qui réduisent la taille utile de la page.

    - J'ai une impression de C++ pré-98. Les divers trucs qui commencent (difficilement, malheureusement) à être connus ne sont pas intégrés à ton code -> pas const-correct, pas exception-safe, p.ex.. GOTW et les FAQ peuvent être des endroits interressants pour commencer -- ou retrouver mes vieux posts sur le sujet. (pas une question de pour faire à la mode, juste qu'il y a des risques d'erreurs qui sont connus)

    - Tu dois pouvoir éviter et isoler les parties non portables -- j'ai vu trainer des conio.h (un en fait, j'ai redardé en vitesse)

    - Je n'ai pas eu l'impression de voir tant de commentaires que ça.

    PS: LAAS dans la partie formation de ton CV ... ça fait bizarre. La formation, ça dépend plutôt de l'UPS normalement.
    Blog|FAQ C++|FAQ fclc++|FAQ Comeau|FAQ C++lite|FAQ BS|Bons livres sur le C++
    Les MP ne sont pas une hotline. Je ne réponds à aucune question technique par le biais de ce média. Et de toutes façons, ma BAL sur dvpz est pleine...

  6. #6
    Membre à l'essai
    Inscrit en
    Mai 2005
    Messages
    6
    Détails du profil
    Informations forums :
    Inscription : Mai 2005
    Messages : 6
    Par défaut
    Oui c'est vrai, lycos me fait ch... . J'utilise opéra et je peut même pas regarder mon site avec

    Pour les commentaires, si tu n'as pas regardé les parties sur les MMC c'est vrai que tu n'as pas du en voir beaucoup car ils sont principalement là.

    En ce qui concerne le portage, j'y travaille et toute la partie acquisition va être refaite. conio.h ne devrait pas être trop dur a supprimer (Et je ne savais pas que se n'était pas portable, merci pour l'info) je n'utilise qu'une fonction (kbhit()). C'est pour l'API que je me fais le plus de soucis. Le problème que j'ai pour le portage c'est que je ne connais presque rien à linux, pour le moment je me documente...

    Sinon pour le C++ pré-98, c'est bien possible. tu as vu mon cv donc tu as pu voir que l'informatique n'ai pas la partie la plus représenté. Je ne vois pas bien de quoi tu veux me parlé (pas const-correct, pas exception-safe, p.ex.. GOTW) mais je v aller voir ça et si tu me dis que ça ne peut que limiter les erreurs, raisons de plus pour si intéressé ;-)

  7. #7
    Membre averti
    Profil pro
    Inscrit en
    Février 2005
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2005
    Messages : 17
    Par défaut
    Salut

    J'ai quelques petites question.

    Je dois moi aussi faire un soft qui fait mumuse avec la parole, mais dans un objectif moindre que le tiens.

    J'ai un fichier son wav 8 bit et je doit trouver le debut d'un mot, on supposera qu'il n'y as pas d'autre personne qui parle, juste un bruit de fond qui gene un peu. Je doit simplement trouver le début du mot.

    Comment faire ? Utilisé la puissance sonore recu ? La puissance sonore quadratique ( celle recu dans la fréquence de la parole humaine - 40-8000 Hz ) ?

    J'ai aussi entendu parler de clef vocale, connais tu ces choses la ?

    Je suis informaticien et on m'as posé le problème.

    Bon maintenant passons à ton projet: Dans quel limite voulez vous reconnaitre la parole ? Allez vous levé les ambiguités ? C'est pour faire un soft de reconnaissance vocale qui sera vouer a remplacer le clavier ? ( J'ai toujours été très intérressé par cette solution même si pour l'instant on en est loin ).

    Je ne connais rien dans le domaine mais c'est passionant

  8. #8
    Membre à l'essai
    Inscrit en
    Mai 2005
    Messages
    6
    Détails du profil
    Informations forums :
    Inscription : Mai 2005
    Messages : 6
    Par défaut
    GOTW c'est pour éviter de faire de faire des reinterpret_cast sur les pointeurs de fonctions membres, c'est bien ça ?

  9. #9
    Expert confirmé
    Avatar de Luc Hermitte
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2003
    Messages
    5 296
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Août 2003
    Messages : 5 296
    Par défaut
    C'est Guru Of The Week -> http://www.gotw.ca/gotw/
    Tu y trouveras la version pré-publication de ce qui a été publié dans la série des Exceptional C++. Il y a quelques items qui traitent de la const-correctness et de l'exception-safety (désolé, je ne connais pas de bonnes traductions en français).

    Si tu comptes persister dans la voie du C++, je ne peux que te conseiller d'y jeter un oeil (avec quantité d'autres livres de chez Addisson-Wesley)

    EDIT: pour le portage, l'idéal est d'abuser de la bibliothèque standard (pour les trucs de base, cela passe bien) et de celles connues pour être portables.
    Après, tout dépend de tes besoins exacts pour ce qui est de les choisir (réseau & multitache, IHM, classes utilitaires, manipulation de sons et images, maths, ...). Il y a quelques pistes dans la FAQ et la section bibliothèques de Développez.
    Blog|FAQ C++|FAQ fclc++|FAQ Comeau|FAQ C++lite|FAQ BS|Bons livres sur le C++
    Les MP ne sont pas une hotline. Je ne réponds à aucune question technique par le biais de ce média. Et de toutes façons, ma BAL sur dvpz est pleine...

  10. #10
    Membre à l'essai
    Inscrit en
    Mai 2005
    Messages
    6
    Détails du profil
    Informations forums :
    Inscription : Mai 2005
    Messages : 6
    Par défaut
    Salut Cunixsvp,
    Si tu veux vraiment te documenter sur le sujet fait une petite recherche avec "voice activity detection" tu trouvera plein de chose, mais le problème c'est qu'une bonne VAD peux vite devenir très compliquer.

    Sinon je te conseil de faire une simple détection de variation d'énergie. ça marche bien et en ajoutant 2 ou 3 condition en plus (comme par exemple la taille minimum de durée d'un mots) on obtient de bon résultat. Il y a une VAD dans APREPA, elle est sommaire mais elle devrait te convenir.

    merci Luc je v potassé tout ça

  11. #11
    Membre à l'essai
    Inscrit en
    Mai 2005
    Messages
    6
    Détails du profil
    Informations forums :
    Inscription : Mai 2005
    Messages : 6
    Par défaut
    Je viens de compléter la section sur l'estimation des paramètres multi-gaussien. Si un mathématicien ou n'importe quelle personne qui ci connaît peut me dire ce qu'il pense de la méthode que j'utilise. Ce serait sympa !

Discussions similaires

  1. Reconnaissance vocale/Synthèse parole
    Par Wulioh dans le forum Algorithmes et structures de données
    Réponses: 5
    Dernier message: 28/10/2010, 01h46
  2. Reconnaissance de la parole
    Par CHATon dans le forum Langages de programmation
    Réponses: 0
    Dernier message: 02/03/2008, 15h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo