IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Reconnaissance vocale (Python)


Sujet :

Python

  1. #1
    Nouveau candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2015
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 27
    Localisation : France, Eure et Loir (Centre)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2015
    Messages : 1
    Par défaut Reconnaissance vocale (Python)
    Bonjour,
    Dans le cadre de mes études j'ai un projet consistant à réaliser un programme de reconnaissance vocale (quelques lettres hachurées, pas des mots entiers). Et pour cela, j'aurai besoin de pouvoir comparer les formants propres à chaque lettre sur Python. Je sais comment obtenir un spectrogramme plutôt bien détaillé mais je n'ai absolument pas d'idée concernant la comparaison de fichiers audio... (Il n'y a pas grand chose sur le net concernant les formants sur python)
    Merci de votre aide !

  2. #2
    Nouveau candidat au Club
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juin 2015
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Juin 2015
    Messages : 2
    Par défaut Comparaison
    Pour la reconnaissance vocale, tu peux t'intéresser aux coefficients mel cepstraux.

    Par exemple, disons que tu as deux sets de sons l'un ou tu prononce le son "a" et le son "b". Les coefficients Mel de permettre de déterminer quel son a été prononcé.

    Pour ce faire constitue une base de donnée de son "a", "b", "c", "ch", ...

    Il faut procéder en trois étapes:

    * calcul les coefficients MEL pour chaque fichier audio
    * applique un algorithme de classification (K-Mean)
    * Quand tu as un nouveau son a testé calcule les MEL our ce son et projete dans l'espace des K-Means pour trouver quel type de son est le plus proche.

    Je te laisse faire les recherches algorithmiques

    Note: tu peux aussi entrainer un réseau de neurones à la place des K-Means

Discussions similaires

  1. [Raspberry Pi B+] Reconnaissance Vocale - Python
    Par kamino62 dans le forum Raspberry Pi
    Réponses: 4
    Dernier message: 13/06/2015, 21h41
  2. Reconnaissance Vocale Python
    Par Little Strong Mind dans le forum Général Python
    Réponses: 0
    Dernier message: 16/03/2014, 13h35
  3. [C#] [WinForms] Reconnaissance vocale ?
    Par vandeyy dans le forum Windows Forms
    Réponses: 3
    Dernier message: 29/11/2004, 14h30
  4. Réponses: 8
    Dernier message: 05/10/2004, 00h02
  5. Logiciel professionnel de reconnaissance vocale
    Par samyl dans le forum Applications et environnements graphiques
    Réponses: 2
    Dernier message: 01/04/2004, 14h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo