Reconnaissance vocale dtw

**Revaroa** · 19/11/2016, 22h21

Bonjour,

Voilà, j'ai des fichiers audio (.wav) qui sont des enregistrements de 13 mots de deux locuteurs : loc1 et loc2.
Maintenant, j'ai fait une fonction de calcul du dtw.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
 
function [D,g]=DTW(sequence1,sequence2)
	% sequence1 est le mot hypothèse
	% sequence2 est le mot de référence
 
	taille2=length(sequence2)+1;
	taille1=length(sequence1)+1;
 
	% construit une matrice 0 avec 1ère ligne et 1ère colonne à +inf et A(0) = 0
  	A=matrice_depart(taille1,taille2); 	
 
	for i=2 : taille2
	  for j=2 : taille1
       	dist = distance_vect(sequence1,sequence2,i-1,j-1);	% calcul la distance entre 2 vecteurs
		A(i,j) = min([A(i-1, j) + dist, A(i-1, j-1) + dist, A(i, j-1) + dist]);
	  end
	end
	g=A;
	D=A(taille2,taille1)/(taille2-1+taille1-1);
end

Normalement, si sequence1 égale à sequence2, la fonction renvoie 0.

Jusque là, ça va. Ensuite, pour faire la reconnaissance du mot faut-il construire une matrice de confusion?
J'ai regarder un peu comment faire la matrice de confusion pour calculer le taux de reconnaissance.
https://fr.wikipedia.org/wiki/Matrice_de_confusion

Et donc, en image ce que j'ai compris pour les 3 premiers mots.
Nom : Capture d’écran 2016-11-19 à 22.23.53.png
Affichages : 409
Taille : 48,4 Ko

Nom : Capture d’écran 2016-11-19 à 22.23.53.png
Affichages : 409
Taille : 48,4 Ko

L'énoncé dit qu'il doit y avoir une seule erreur entre loc1 et loc2, lorsque je fais la matrice de confusion, j'obtiens une matrice diagonale alors que je devrais avoir une erreur quelque part, je comprends pas.

Est-ce que quelqu'un pourrait m'éclairer?

Merci d'avance.

Reconnaissance vocale dtw

Signal

Discussions similaires

Partager

Partager