IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Composants FMX Delphi Discussion :

Synthèse parole et détection vocale


Sujet :

Composants FMX Delphi

  1. #21
    Membre extrêmement actif
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2017
    Messages
    2 243
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Octobre 2017
    Messages : 2 243
    Par défaut
    Bon, l'ajout de voix parlant dans une langue précise pour la synthèse vocale ne s'avère pas trop compliqué, il s'agit juste de se perdre dans les menus, sous-menus et sous-sous-menus de l'interface Android qui équipe son appareil.

    Pour résumer la situation, si l'appareil Android est équipé de la synthèse vocale:

    1. Un appareil Android est équipé d'un ou plusieurs moteurs vocaux (cela dépend du fabricant de l'appareil)

    2. Par défaut, un appareil Android est équipé d'une ou plusieurs voix dans une ou plusieurs langues (cela dépend du fabricant de l'appareil)

    3. Il est possible de télécharger de nouvelles voix/langues (dépend du moteur vocal: Samsung offre plusieurs voix pour chaque langue (homme/femme en un ou plusieurs variantes), Google offre une seule voix par langue sans indiquer s'il s'agit d'une voix de femme ou d'homme (peut-être que l'on télécharge les 2 sans s'en rendre compte, mais au final par défaut, c'est la voix d'une femme)).

    4. La manipulation à réaliser change d'un appareil à l'autre (même entre différents modèles d'un même fabricant )


    Bien sûr pour éviter des sueurs froides à l'utilisateur lambda, il faudrait pouvoir effectuer automatiquement cette opération via un script inclus dans le fichier .apk, mais là je ne sais pas faire, ne sais pas si cela est réalisable, ni n'ai envie d'y passer du temps pour le savoir...

  2. #22
    Membre extrêmement actif
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2017
    Messages
    2 243
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Octobre 2017
    Messages : 2 243
    Par défaut
    Bonjour à tous,

    J'écris ces quelques lignes pour faire profiter les lecteurs de mon expérience de la reconnaissance vocale avec l'aide de Google...

    J'avais écrit ce qui suit:

    Citation Envoyé par Anselme45 Voir le message
    ..."il faut faire appel à un serveur distant Google" puis une news révolutionnaire... datant elle de 2019 qui dit Google a introduit dans son OS Android un "service, super, hyper génial, qui doit encore être amélioré et qui n'équipe qu'un seul type de téléphone, qui permet la reconnaissance de la parole en local sur le téléphone mais uniquement en anglais". Nous sommes en 2022, est-ce que ce projet à été amélioré par Google depuis 2019? Mystère...
    Nous sommes en juillet 2022 et j'ai constaté que le service en question (android.speech.SpeechRecognizer) était présent sur la plupart des appareils à partir de Android 10 (mais pas tous!).

    1. Il peut fonctionner en local mais affiche périodiquement un message indiquant qu'il transmet les info à Google

    2. Il semble être disponible en plusieurs langues (mon test s'est limité à Anglais-US)

    3. Lorsque que l'on met le service en écoute, une fenêtre Google apparaît en surimpression de l'app Delphi. Il y a reconnaissance vocale ou... non (un message d'erreur style "Pas compris... Veuillez répéter") puis la main est redonnée à l'app Delphi avec le résultat obtenu.


    Vu les résultats obtenus, pas besoin d'entrer dans le détail... C'est tout simplement inutilisable pour un usage pro...

    1. Il dit rarement "pas compris", mais reconnait souvent n'importe quoi!!!

    2. Le service a plus de réussite avec des phrases complètes "bateau" du style "what do you think about that?" (que penses-tu de cela?), mais lorsqu'il s'agit de mots individuels (nécessaire dans le cas d'une commande vocale), cela relève de la série gagnante à l'Euro-million: Un "green" (la couleur verte en français) est reconnu comme "we" ("nous" en français), "restore" devient "Play store", etc...

    3. A remarquer que le service est beaucoup plus efficace lorsqu'il fonctionne en ligne: Un mot prononcé sur un appareil Android ayant accès aux serveurs Google sera souvent détecté correctement (Si on dit "reset", le service Google proposera une seule proposition "reset"), le même mot prononcé avec un appareil Android déconnecté du web sera mal détecté (Si on dit "reset", le service Google va proposer 4 ou 5 propositions plus ou moins étonnantes, le bon terme peut s'y trouver... ou non: On dit "reset" et le service Google propose "set","receipt", "reset", "recent" et "I sent"

    Bref, à ce jour, ce service n'est clairement pas mature pour un usage sérieux... Le système va fonctionner par "beau temps" si toute une série de conditions sont réunies mais dans le cadre d'un produit commercialisé, c'est courir énormément de risque: Que dire à un client mécontent qui a investi dans notre produit? A part lui dire "on s'excuse et on vous rembourse!", le développeur est dans l'impossibilité de fiabiliser la fonction "reconnaissance vocale" de son produit.

  3. #23
    Membre Expert
    Avatar de pprem
    Homme Profil pro
    MVP Embarcadero - formateur&développeur Delphi, PHP et JS
    Inscrit en
    Juin 2013
    Messages
    1 876
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : MVP Embarcadero - formateur&développeur Delphi, PHP et JS
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 876
    Par défaut
    Citation Envoyé par Anselme45 Voir le message
    Bref, à ce jour, ce service n'est clairement pas mature pour un usage sérieux... Le système va fonctionner par "beau temps" si toute une série de conditions sont réunies mais dans le cadre d'un produit commercialisé, c'est courir énormément de risque: Que dire à un client mécontent qui a investi dans notre produit? A part lui dire "on s'excuse et on vous rembourse!", le développeur est dans l'impossibilité de fiabiliser la fonction "reconnaissance vocale" de son produit.
    Le savoir est déjà une bonne chose.

    Pour le client, il suffit de signaler quelque part (pas trop caché, on n'est pas SFR) que la reconnaissance vocale utilise un système embarqué dans Android qui nécessite une connexion Internet pour fonctionner dans de bonnes conditions.

    Serais curieux de voir ce que ça donne sur un iPhone avec un iOS moderne vu que Apple se vante d'avoir embarqué une partie de Siri en local sans connexion.

  4. #24
    Membre extrêmement actif
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Octobre 2017
    Messages
    2 243
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Octobre 2017
    Messages : 2 243
    Par défaut
    Citation Envoyé par pprem Voir le message
    Serais curieux de voir ce que ça donne sur un iPhone avec un iOS moderne vu que Apple se vante d'avoir embarqué une partie de Siri en local sans connexion.
    Pour avoir la réponse à ta question, il faudra compter sur quelqu'un d'autre.

    Notre société ne porte pas ses app sur IOS (on ne fait pas dans le grand public mais uniquement des app destinées au monde pro). Et franchement, aucun de nos clients n'est d'accord de payer une licence annuelle à Apple pour avoir le droit d'utiliser une app qui n'appartient pas à Apple (pour rappel, à la différence des app destinées au grand public, l'usage d'une app pro exige le paiement d'une licence annuelle à Apple) et notre société ne va pas dépendre du bon vouloir d'un mec de Apple que l'on ne connaît pas pour savoir si Apple acceptera ou non notre app sur sa plateforme de distribution qu'il est impossible de court-circuiter.

    Il y a ceux qui acceptent les diktats et les autres...

Discussions similaires

  1. Reconnaissance vocale/Synthèse parole
    Par Wulioh dans le forum Algorithmes et structures de données
    Réponses: 5
    Dernier message: 28/10/2010, 01h46
  2. Synthèse Vocale avec Automation
    Par LeGugusse dans le forum WinDev
    Réponses: 6
    Dernier message: 05/02/2009, 22h29
  3. [C] Synthèse vocale sous Windows
    Par Electroniktor dans le forum Windows
    Réponses: 10
    Dernier message: 21/12/2007, 22h01
  4. Synthèse vocale
    Par Gilles Louïse dans le forum Autres Logiciels
    Réponses: 1
    Dernier message: 11/11/2005, 12h41
  5. synthèse vocale libre et gratuite
    Par widad_pgm dans le forum Autres Logiciels
    Réponses: 3
    Dernier message: 26/04/2004, 12h58

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo