Bonjour,

Je cherche à terminer un programme de reconnaissance vocale entre une référence et un échantillon, donc je vais procéder par déformation temporelle dynamique.

Après avoir stocké les 2x12 coefficients MFCC dans 2 matrices séparés
Il faut les comparer, alors j'ai procédé comme ceci :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
 
d= dist(y1,y2'); %mes 2 matrices après MFCC
Puis pour exploiter le résultat, il me faut trouver le "score".
J'ai alors pensé à la norme infinie mais les résultats sont trop "homogènes" : c'est toujours le même échantillon qui a le score le plus faible et idem pour le plus gros ...

Normaliser n'a pas l'air d'être la solution : quelqu'un aurait une idée pour une autre démarche ? J'ai entendu parler de chemin le plus court après la distance euclidienne entre matrices, mais je n'ai pu trouver de code sur matlab qui marche encore. Quelqu'un pourrait-il m'éclairer sur le sujet ?

Merci d'avance