Bonjour,

Etant donné mon ignorance du sujet et constatant que des fonctions était déjà disponnible pour reconnaitre un locuteur en mode indépendant du texte, j'ai tenté d'exécuter ces fonctions pour voir ce que ça donnait... Malheureusement, ça ne fait pas vraiment ce que je souhaite

En effet, je souhaite:

- dans un premier temps visualiser mes 12 coefficients cepstraux pour chaque sous-trames, un peu comme le décrit l'image suivante:



A la place, j'obtiens un gros mélange par sous-trame comme le décrit l'image suivante:



- dans un second temps visualiser une gaussienne suivant l'allure de mes coefficients cepstraux, comme ça:



A la place, même topo j'obtiens un gros mélange (je ne vois même pas à quoi cela correspond) :



Voici le code avec lequel, j'appelle les fonctions que j'ai trouvées:

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
 
clc
clear all
close all
 
 
[s1, fs]=wavread('5.wav');
fs
s1 = resample(s1, fs/3, fs);
h=length(s1)
X=precut(s1);
n=length(X)
 
 
 
for j=1:10
 
 
    NB=[X{j}];
 
    figure(4)
    subplot(10,1,j)
    plot(NB)
    grid
 
    figure(5)
    y = melcepst(NB, fs/3)
    subplot(10,1,j)
    hist(y)
 
    figure (6)
    z = gmm_estimate(y,48);
    subplot(10,1,j)
    hist(z)
    axis([-6 6 0 400])
 
 
end
Et ici vous pouvez trouver les fonctions que j'utilise:

http://www.mediafire.com/?1ennci0d2jx

Si quelqu'un peut me conseiller, je lui en serais bien reconnaissant!

Cordialement,

François