Bonjour,

Je fais un projet dans lequel je suis censée traiter un signal sonore échantillonné, dans le but de différentier des voyelles.

Pour cela, j'utilise la bibliothèque "fftw3.h".

Normalement, pour reconnaitre une voyelle, on a besoin des trois premières fréquences (la fondamentale et donc les deux premières harmoniques).
Cependant, cela ne fonctionne pas.
Je ne suis pas sure de la "pertinence" du résultat fréquentielle de la fftw (surtout que, même lorsqu'il n'y a pas de son, il y a des fréquences qui sont toujours actives, cf ici).
À cause de ces fréquences toujours active, j'ai essayer de prendre en compte plus de fréquences, mais la reconaissance n'est toujours pas pertinente.
Avez vous des idées de pourquoi ça ne fonctionne pas ?

Sinon, sur internet j'ai lu aussi qu'il existait d'autres processus pour différentier des sons distincts : notamment les filtres "gammatone" et MFCC (Ceptrum and Mel Cepstrum coef).
Lié à ça j'ai notamment vu une librairie en c permettant de calculer le MFCC.
Cependant j'ai du mal à comprendre les différents paramètres que l'on doit renseigner à partir de la fftw.

Mes questions sont alors les suivantes :
1. Avez vous une idée de pourquoi les premières fréquences de la fftw sont insuffisante pour différentier des son ? ("a" "i" et "o")
2. Pouvez vous m'aider pour l'utilisation des gammatones et MFCC en programmation C? (je ne comprends pas suffisamment leur fonctionnement et toute la documentation que je trouve j'ai beaucoup de mal à la comprendre)