Voici un site que j'ai créé sur un logiciel d'APprentissage et de REconnaissance de parole, il s'appelle APREPA.
http://membres.lycos.fr/persoac/index.html
J'attends vos réactions...
Voici un site que j'ai créé sur un logiciel d'APprentissage et de REconnaissance de parole, il s'appelle APREPA.
http://membres.lycos.fr/persoac/index.html
J'attends vos réactions...
Je trouve le site pas mal, tu as l'aire de bien détallé ton projet, il te reste a compéter quelques blanc et ca sera bon. J'ai habitude des sites web donc je nbe parlerais pas de la mise en forme.
Tres interessant![]()
Il me reste encore pas mal de boulot sur le site mais j'avance petit à petit...
Il faut dire aussi que c'est pas la partie la plus passionnante et que c'est mon premier site (donc je rame...).
Pour bien tous comprendre du projet avec ce qu'il y a sur le site c'est pas évidant mais normalement le code est bien commenté et pour peut qu'on connaisse un peut les modèles de Markov y à pas de pb ;-)
Quelqu'un a testé ?
Ou regardé le source (personne ne l'a encore vu donc je suis preneur de 2 3 remarques)
En vrac. Des remarques techniques, je n'ai pas regardé la partie MMC et reco de parole, mes souvenirs sur le sujet, sont tout juste des souvenirs, bien trop lointains.
- Arg! Lycos et ses bannières qui réduisent la taille utile de la page.
- J'ai une impression de C++ pré-98. Les divers trucs qui commencent (difficilement, malheureusement) à être connus ne sont pas intégrés à ton code -> pas const-correct, pas exception-safe, p.ex.. GOTW et les FAQ peuvent être des endroits interressants pour commencer -- ou retrouver mes vieux posts sur le sujet. (pas une question de pour faire à la mode, juste qu'il y a des risques d'erreurs qui sont connus)
- Tu dois pouvoir éviter et isoler les parties non portables -- j'ai vu trainer des conio.h (un en fait, j'ai redardé en vitesse)
- Je n'ai pas eu l'impression de voir tant de commentaires que ça.
PS: LAAS dans la partie formation de ton CV ... ça fait bizarre. La formation, ça dépend plutôt de l'UPS normalement.
Blog|FAQ C++|FAQ fclc++|FAQ Comeau|FAQ C++lite|FAQ BS|Bons livres sur le C++
Les MP ne sont pas une hotline. Je ne réponds à aucune question technique par le biais de ce média. Et de toutes façons, ma BAL sur dvpz est pleine...
Oui c'est vrai, lycos me fait ch... . J'utilise opéra et je peut même pas regarder mon site avec![]()
Pour les commentaires, si tu n'as pas regardé les parties sur les MMC c'est vrai que tu n'as pas du en voir beaucoup car ils sont principalement là.
En ce qui concerne le portage, j'y travaille et toute la partie acquisition va être refaite. conio.h ne devrait pas être trop dur a supprimer (Et je ne savais pas que se n'était pas portable, merci pour l'info) je n'utilise qu'une fonction (kbhit()). C'est pour l'API que je me fais le plus de soucis. Le problème que j'ai pour le portage c'est que je ne connais presque rien à linux, pour le moment je me documente...
Sinon pour le C++ pré-98, c'est bien possible. tu as vu mon cv donc tu as pu voir que l'informatique n'ai pas la partie la plus représenté. Je ne vois pas bien de quoi tu veux me parlé (pas const-correct, pas exception-safe, p.ex.. GOTW) mais je v aller voir ça et si tu me dis que ça ne peut que limiter les erreurs, raisons de plus pour si intéressé ;-)
Salut
J'ai quelques petites question.
Je dois moi aussi faire un soft qui fait mumuse avec la parole, mais dans un objectif moindre que le tiens.
J'ai un fichier son wav 8 bit et je doit trouver le debut d'un mot, on supposera qu'il n'y as pas d'autre personne qui parle, juste un bruit de fond qui gene un peu. Je doit simplement trouver le début du mot.
Comment faire ? Utilisé la puissance sonore recu ? La puissance sonore quadratique ( celle recu dans la fréquence de la parole humaine - 40-8000 Hz ) ?
J'ai aussi entendu parler de clef vocale, connais tu ces choses la ?
Je suis informaticien et on m'as posé le problème.
Bon maintenant passons à ton projet: Dans quel limite voulez vous reconnaitre la parole ? Allez vous levé les ambiguités ? C'est pour faire un soft de reconnaissance vocale qui sera vouer a remplacer le clavier ? ( J'ai toujours été très intérressé par cette solution même si pour l'instant on en est loin ).
Je ne connais rien dans le domaine mais c'est passionant![]()
GOTW c'est pour éviter de faire de faire des reinterpret_cast sur les pointeurs de fonctions membres, c'est bien ça ?
C'est Guru Of The Week -> http://www.gotw.ca/gotw/
Tu y trouveras la version pré-publication de ce qui a été publié dans la série des Exceptional C++. Il y a quelques items qui traitent de la const-correctness et de l'exception-safety (désolé, je ne connais pas de bonnes traductions en français).
Si tu comptes persister dans la voie du C++, je ne peux que te conseiller d'y jeter un oeil (avec quantité d'autres livres de chez Addisson-Wesley)
EDIT: pour le portage, l'idéal est d'abuser de la bibliothèque standard (pour les trucs de base, cela passe bien) et de celles connues pour être portables.
Après, tout dépend de tes besoins exacts pour ce qui est de les choisir (réseau & multitache, IHM, classes utilitaires, manipulation de sons et images, maths, ...). Il y a quelques pistes dans la FAQ et la section bibliothèques de Développez.
Blog|FAQ C++|FAQ fclc++|FAQ Comeau|FAQ C++lite|FAQ BS|Bons livres sur le C++
Les MP ne sont pas une hotline. Je ne réponds à aucune question technique par le biais de ce média. Et de toutes façons, ma BAL sur dvpz est pleine...
Salut Cunixsvp,
Si tu veux vraiment te documenter sur le sujet fait une petite recherche avec "voice activity detection" tu trouvera plein de chose, mais le problème c'est qu'une bonne VAD peux vite devenir très compliquer.
Sinon je te conseil de faire une simple détection de variation d'énergie. ça marche bien et en ajoutant 2 ou 3 condition en plus (comme par exemple la taille minimum de durée d'un mots) on obtient de bon résultat. Il y a une VAD dans APREPA, elle est sommaire mais elle devrait te convenir.
merci Luc je v potassé tout ça![]()
Je viens de compléter la section sur l'estimation des paramètres multi-gaussien. Si un mathématicien ou n'importe quelle personne qui ci connaît peut me dire ce qu'il pense de la méthode que j'utilise. Ce serait sympa !
Partager