salut pour tous ,
Mon projet de fin d'etude est un resume video d'un match de football
j'utlise pour le moment c++,qt et opencv.
L'idée est comme suit :
etape1-extraire le son du video
etape2-transcriptiion du son en text
etape3-dégager les mots clé du text suivant les quelles je vai choisir les keyframes .
est ce que quel q'un peut m'aider a l'etape 1 et 2 : comment extraire le son du video et quel est la bibliotheque necessaire ?
et comment transformer le son en text ( code source ou prg a utlise avec c++) ?
si vous avez d'autre idée merci de les mentionées
et merci davance






Répondre avec citation

. C'est vraiment très complexe de convertir des voix en texte de manière automatisée, tu t'en rends compte j'imagine... Juste le fait de déchiffrer correctement tous les mots est en soi un exploit à l'heure actuel, alors rajoute à ça une intonation variable, la ponctuation à gérer, et des fans qui hurlent dans un match de foot.




Partager