IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

[son] conseils bibliotèque


Sujet :

C++

  1. #1
    cedrix57
    Invité(e)
    Par défaut [son] conseils bibliotèque
    Bonjour,

    Je vais avoir besoin de découper une piste audio (par exemple ouvrir une piste de 4 minutes, en enregistrer le passage de 0'30 à 0'47, concaténer avec celui de 1'10 à 1'59.
    Je vais aussi avoir besoin d'analyser un signal audio (par exemple la bande son d'une bande annonce d'un film), et pour un endroit donné, je vais devoir devoir détecter ou commence et fini la phrase courante (tant que les fréquence sont hautes).

    Je ne sait pas quel bibliothèque utilisée. Pourriez vous me conseiller ? Je pense à fmod, mais il y en a peut être des plus simples à utiliser qui me permettront de faire ça ? ou bien fmod n'est pas adapté à ce genre de manipulation ?

    Merci d'avance

  2. #2
    Responsable 2D/3D/Jeux


    Avatar de LittleWhite
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mai 2008
    Messages
    26 859
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Mai 2008
    Messages : 26 859
    Points : 218 580
    Points
    218 580
    Billets dans le blog
    120
    Par défaut
    Bonjour,

    Pour tout ce que vous demander, je ne sais pas quoi répondre.

    Je connais fmod, et cela ne conviendra pas à ce que vous voulais. En plus vous voulez un logiciel de détection de la voix ( début et fin ). Ça non plus je ne connais pas, mais il me semble que cela se rapproche du speech to text ( du parler au texte ).

    Mais je ne sais pas quoi dire, peut être chercher autour de la bibliothèque utilisé par Audacity.
    Vous souhaitez participer à la rubrique 2D/3D/Jeux ? Contactez-moi

    Ma page sur DVP
    Mon Portfolio

    Qui connaît l'erreur, connaît la solution.

  3. #3
    Membre expert
    Avatar de Klaim
    Homme Profil pro
    Développeur de jeux vidéo
    Inscrit en
    Août 2004
    Messages
    1 717
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur de jeux vidéo
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2004
    Messages : 1 717
    Points : 3 344
    Points
    3 344
    Par défaut
    OpenAl est la bibliothèque C "bas niveau" de son open source la plus utilisée, mais elle est vraiment pas pratique quand on veut faire des choses...."simples".

    Donc il se peut que cAudio, qui est un wrapper C++ d'OpenAL fasse l'affaire : http://caudio.deathtouchstudios.com/

    Cela dit, c'est assez neuf et je n'ai jamais utilisé donc difficile de dire ce que ça vaut. En tout cas j'envisage de l'utiliser a la place de fmod chez moi, voir ce que ça donne et surtout pour éviter de payer une licence quand je pourrais vendre mon projet.

  4. #4
    Responsable 2D/3D/Jeux


    Avatar de LittleWhite
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Mai 2008
    Messages
    26 859
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Mai 2008
    Messages : 26 859
    Points : 218 580
    Points
    218 580
    Billets dans le blog
    120
    Par défaut
    J'avais pense a OpenAL, mais cela ne correspond pas du tout a ce que veux faire cedrix57.

    Si j'ai bien compris, il veut:

    - faire du decoupage selon la position
    - Faire une analyse spectrale pour savoir si il y a une voix ( je simplifie un peu ).

    Finalement, peut etre que FMOD pourra suffire, car avec cela, on peut se placer a la position que l'on veut, lire, et s'arreter. Par contre, on ne pourra pas enregistrer le fichier couper par exemple.
    OpenAL, ne permet "que" de faire des positionnements de son dans un espace 3D. Il n'est meme pas capable de lire les fichiers sons >_< (sans ALU)

    Sinon, si cedrix57, n'a qu'un format de fichier a supporter, pourquoi ne pas se pencher sur la bibliotheque specialise pour ce format de fichier?
    Vous souhaitez participer à la rubrique 2D/3D/Jeux ? Contactez-moi

    Ma page sur DVP
    Mon Portfolio

    Qui connaît l'erreur, connaît la solution.

  5. #5
    Membre expert
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    1 415
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Mars 2007
    Messages : 1 415
    Points : 3 156
    Points
    3 156
    Par défaut
    Salut

    Pour le découpage, manipulation, encodage, etc, de fichiers sons, tu peux te tourner vers ffmpeg. Ca fait aussi la vidéo mais ça ne pose pas à priori de problème, ffmpeg sait gérer du son seul.

    Pour le speech recognition, tu peux regarder ici : http://en.wikipedia.org/wiki/List_of...ition_software
    Find me on github

Discussions similaires

  1. Réponses: 1
    Dernier message: 11/08/2011, 16h36
  2. Réponses: 6
    Dernier message: 02/07/2006, 09h28
  3. [Conseil] Choix de son forum
    Par Acti dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 4
    Dernier message: 19/08/2005, 13h08

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo