Bonjour,
Etant donné mon ignorance du sujet et constatant que des fonctions était déjà disponnible pour reconnaitre un locuteur en mode indépendant du texte, j'ai tenté d'exécuter ces fonctions pour voir ce que ça donnait... Malheureusement, ça ne fait pas vraiment ce que je souhaite
En effet, je souhaite:
- dans un premier temps visualiser mes 12 coefficients cepstraux pour chaque sous-trames, un peu comme le décrit l'image suivante:
A la place, j'obtiens un gros mélange par sous-trame comme le décrit l'image suivante:
- dans un second temps visualiser une gaussienne suivant l'allure de mes coefficients cepstraux, comme ça:
A la place, même topo j'obtiens un gros mélange (je ne vois même pas à quoi cela correspond) :
Voici le code avec lequel, j'appelle les fonctions que j'ai trouvées:
Et ici vous pouvez trouver les fonctions que j'utilise:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38 clc clear all close all [s1, fs]=wavread('5.wav'); fs s1 = resample(s1, fs/3, fs); h=length(s1) X=precut(s1); n=length(X) for j=1:10 NB=[X{j}]; figure(4) subplot(10,1,j) plot(NB) grid figure(5) y = melcepst(NB, fs/3) subplot(10,1,j) hist(y) figure (6) z = gmm_estimate(y,48); subplot(10,1,j) hist(z) axis([-6 6 0 400]) end
http://www.mediafire.com/?1ennci0d2jx
Si quelqu'un peut me conseiller, je lui en serais bien reconnaissant!
Cordialement,
François
Partager