Reconnaissance vocale - Butterworth & fenêtrage

**didier.brun** · 07/01/2010, 18h59

Bonjour tout le monde,

Je suis en train de travailler sur un système de reconnaissance vocale monolocuteur (sur des mots isolés).

Voilà en gros, les étapes que je compte traiter :

1) Acquisition du signal & rééchantillonage (mon aquisition se fait en 44kz, je compte descendre à 20 khz pour améliorer les temps de calcul)

2) Normalisation du signal (volume)

3) Filtre de Butterworth pour nettoyer un peu le son

4) Fenêtrage de Hamming

5) Extraction des LPC

6) Comparaison DTW des vecteurs LPC avec une petite base de mots.

J'ai déjà implémenter l'acquisition, la normalisation et le filtre de Butterworth (merci à pseudocode pour cet excellent billet http://www.developpez.net/forums/d68...bas-signal-1d/)

Mais j'ai déjà quelques questions :

1) Est-ce-qu'il est préférable d'appliquer le filtre de Butterworth au son entier avant fenetrage ou bien appliquer le filtre aux portions fenetrées, avant extraction des LPC ?

2) Connaissez-vous un filtre passe-bas qui serait moins gourmand en temps de calcul que Butterworth pour un résultat a peu prés équivalent ?

Merci d'avance pour votre aide.

**abidineb** · 12/01/2010, 15h12

Bonjour
Pour l'etape1: tu dit rée-échantillonnage, le terme sous-échantillonnage est mieux adapté dans ton cas.
Tu dit tu veut netoyer quoi? du bruit? c'est pour ça tu applique ton filtre butherworth?
Bref, tu dit (Est-ce-qu'il est préférable d'appliquer le filtre de Butterworth au son entier avant fenêtrage ou bien appliquer le filtre aux portions fenêtrées, avant extraction des LPC ?), déjà t'as propose d'abord pour un son entier après tu as proposé le cas après fenêtrage, déjà je pense que t'as opte pour le premier cas, et c'est le bon, c'est tout t'as fait logique.
Moi j'utilise le filtre Butterworth pour ces bon résultats et pas d'autres.

Cordialement

Reconnaissance vocale - Butterworth & fenêtrage

Algorithmes et structures de données

Discussions similaires

Partager

Partager