Bonjour,
Je cherche à terminer un programme de reconnaissance vocale entre une référence et un échantillon, donc je vais procéder par déformation temporelle dynamique.
Après avoir stocké les 2x12 coefficients MFCC dans 2 matrices séparés
Il faut les comparer, alors j'ai procédé comme ceci :
Puis pour exploiter le résultat, il me faut trouver le "score".Code:
1
2 d= dist(y1,y2'); %mes 2 matrices après MFCC
J'ai alors pensé à la norme infinie mais les résultats sont trop "homogènes" : c'est toujours le même échantillon qui a le score le plus faible et idem pour le plus gros ...
Normaliser n'a pas l'air d'être la solution : quelqu'un aurait une idée pour une autre démarche ? J'ai entendu parler de chemin le plus court après la distance euclidienne entre matrices, mais je n'ai pu trouver de code sur matlab qui marche encore. Quelqu'un pourrait-il m'éclairer sur le sujet ? :roll:
Merci d'avance