IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Programmation multimédia/Jeux Python Discussion :

problématique sur mon code de reconnaisance de la parole


Sujet :

Programmation multimédia/Jeux Python

  1. #1
    Candidat au Club
    Homme Profil pro
    Architecte matériel
    Inscrit en
    Février 2023
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 29
    Localisation : France, Drôme (Rhône Alpes)

    Informations professionnelles :
    Activité : Architecte matériel
    Secteur : Alimentation

    Informations forums :
    Inscription : Février 2023
    Messages : 2
    Points : 4
    Points
    4
    Par défaut problématique sur mon code de reconnaisance de la parole
    Bonjour,

    Mon objectif est de coder en python un outil permettant de créer un fichier texte à partir de tout ce qui se dit dans le micro (pendant une réunion par exemple). La durée d'enregistrement total est la durée entre l'appui sur le bouton start et le bouton stop pour arreter l'enregistrement.

    Etant débutant et ayant vu quelques tutoriels, je me suis lancer avec la bibliotheque ; speech_recognition

    Mon but est d'avoir un code me permettant de rentrer le nom de ma reunion du jour puis de retranscrire en texte tout ce qui se dit pendant la réunion sachant qu'il peux y avoir des blancs de plusieurs secondes et des bruits d'ambiances (une personne qui toc à la porte, une personne qui souffle ou qui fait atchoum etc.)

    Je vous remercie par avance de votre aide et du temps que vous consacrerez à m'aider.

  2. #2
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 038
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 038
    Points : 8 405
    Points
    8 405
    Par défaut
    salut,

    juste quelques infos; au delà du code assez simple il y a essentiellement 2 aspects qui peuvent limiter l'intérêt/la faisabilité de ton projet.

    d'abord SpeechRecognition, pourquoi pas, mais ça sous-entend d'avoir une connexion internet pas trop déconnante pour pouvoir en continu (ou quasiment) envoyer les chunks audio chez Google pour qu'il te renvoie la version texte.
    une alternative intéressante c'est d'utiliser Vosk dont les modèles sont stockés localement et sont assez performants.

    l'autre problème c'est le(s) micro(s), inutile d'espérer capter la voix de tous les interlocuteurs dans une salle de réunion pour vingt personnes, il faut soit un micro par interlocuteur soit investir dans un (ou plusieurs) micro(s) multidirectionnel(s) assez puissant(s).

    enfin il y a des considérations plus classiques à prendre en compte, comme l'identification éventuelle de chaque interlocuteur, les gens qui causent trop vite et/ou parlent en même temps que les autres, créant un brouhaha que l'IA n'arrivera tout simplement pas à déchiffrer etc.

    le tout fait que le code python en soi n'est pas forcément très compliqué mais le projet en lui-même peut être assez difficile à mettre en œuvre efficacement, et si malgré tout ça finit par fonctionner à peu près le compte rendu final nécessitera probablement toujours une relecture attentive.

    exemple, la reconnaissance vocale pond un résultat du genre "les primes seront traversées cette année", va-t-en savoir après coup quand tu relis au calme si la phrase était "les primes seront versées" ou "les primes ne seront pas versées"
    et encore il s'agit là d'une ambiguïté relativement facile à lever, nul doute que certaines phrases risquent de prêter bien plus à confusion...

  3. #3
    Membre expérimenté
    Avatar de MPython Alaplancha
    Homme Profil pro
    Paysan à 3 francs six sous
    Inscrit en
    Juin 2018
    Messages
    905
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Paysan à 3 francs six sous
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Juin 2018
    Messages : 905
    Points : 1 592
    Points
    1 592
    Billets dans le blog
    6
    Par défaut
    Bonjour,
    une alternative intéressante c'est d'utiliser Vosk dont les modèles sont stockés localement et sont assez performants.
    Intéressant en effet :Licence Apache, léger, à priori compilable avec Buildozer pour android. Reste à voir son usage... Je garde ça sous la main. Merci pour ce partage.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Demande d'aide sur mon code
    Par b.soufiane dans le forum C++
    Réponses: 6
    Dernier message: 07/12/2007, 17h36
  2. Aide sur mon Code !
    Par b.soufiane dans le forum C
    Réponses: 10
    Dernier message: 07/12/2007, 13h38
  3. petit probleme sur mon code
    Par MORPHEUS50 dans le forum Balisage (X)HTML et validation W3C
    Réponses: 2
    Dernier message: 13/05/2007, 19h16
  4. [FFT] Votre avis sur mon code
    Par deubelte dans le forum C++
    Réponses: 1
    Dernier message: 10/02/2007, 21h14
  5. Doute sur mon code, découpage de texte
    Par goblin dans le forum Langage
    Réponses: 3
    Dernier message: 16/10/2006, 21h26

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo