IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Actualités Discussion :

Google dévoile quelques secrets sur la recherche vocale

  1. #1
    Responsable .NET

    Avatar de Hinault Romaric
    Homme Profil pro
    Consultant
    Inscrit en
    Janvier 2007
    Messages
    4 570
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Consultant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Janvier 2007
    Messages : 4 570
    Points : 252 372
    Points
    252 372
    Billets dans le blog
    121
    Par défaut Google dévoile quelques secrets sur la recherche vocale
    Google dévoile quelques secrets sur la recherche vocale
    la précision du système extrêmement liée à la quantité de données

    Google Research, la division de recherche de Google a publié un document qui décrit un peu comment sa technologie de recherche vocale fonctionne.

    Les mécanismes qui sont développés au sein de ses applications de reconnaissance vocale reposent essentiellement sur les données.

    En effet, les chercheurs ont constaté que la présence des quantités de données énormes entraine moins d’erreurs lors de la prédiction du mot suivant en fonction des mots qui le précèdent.

    Selon l’article publié par Google, son implémentation de la recherche vocale utilise principalement des données provenant des requêtes anonymes sur Google.com pour créer un modèle de langue important, qui permet d’assigner la probabilité du mot suivant dans une phrase en fonction des mots précédents.

    Le chercheur Ciprian Chelba de Google, explique que si par exemple, les mots précédents sont « New York », le modèle de langue attribuera une plus grande probabilité à « pizza » par rapport à « granola ».

    Dans leurs analyses, les chercheurs de Google ont utilisé plus de 230 milliards de mots d’un échantillon aléatoire de requêtes anonymes du moteur Google qui ne déclenchent pas une correction orthographique.

    Ceux-ci ont constaté qu’avec un tel ensemble de données, le taux d’erreur pouvait être réduit de 6 à 10 %, et pour les systèmes disposant d’un échantillon encore plus large, la réduction du taux d’erreur pouvait être de 17 à 52%.

    Google dévoile ce document pratiquement au même moment que sort une mise à jour de son application de recherche pour iOS, dont la nouveauté la plus mise en avant est l’amélioration de la recherche vocale.


    Source : Blog Google Research

  2. #2
    Membre émérite

    Homme Profil pro
    Software Developer
    Inscrit en
    Mars 2008
    Messages
    1 470
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Software Developer

    Informations forums :
    Inscription : Mars 2008
    Messages : 1 470
    Points : 2 372
    Points
    2 372
    Par défaut
    La quantité de données et la puissance de traitement qu'il faut derriere, le tout pour des résultats quasi-instantanés...
    Ce doit etre intéressant de voir tout ca de l'intérieur.

  3. #3
    Membre émérite
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Décembre 2008
    Messages
    832
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Décembre 2008
    Messages : 832
    Points : 2 621
    Points
    2 621
    Par défaut
    Utiliser la "prédiction" statistique de ce que la requête de l'utilisateur pourrait être implique que google va enfermer encore plus ses utilisateur dans leur bulle...
    Mais bon, les gens s'en moquent, je suppose.

  4. #4
    Membre émérite

    Homme Profil pro
    Software Developer
    Inscrit en
    Mars 2008
    Messages
    1 470
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Software Developer

    Informations forums :
    Inscription : Mars 2008
    Messages : 1 470
    Points : 2 372
    Points
    2 372
    Par défaut
    Citation Envoyé par Freem Voir le message
    Utiliser la "prédiction" statistique de ce que la requête de l'utilisateur pourrait être implique que google va enfermer encore plus ses utilisateur dans leur bulle...
    Mais bon, les gens s'en moquent, je suppose.
    Peux-tu développer ton raisonnement davantage s'il te plait?
    Je ne penses pas que si Google sait prédire le mot suivant d'une requete implique que les utilisateurs restent attaché a Google. Mais tu as l'air de penser a autre chose.

    Perso je regarde plutot l'aspect technique de la chose, de toute maniere j'ai supprimé toute trace des services Google de mon quotidien, comme quoi on peux vivre sans.

  5. #5
    Membre actif
    Profil pro
    Inscrit en
    Février 2009
    Messages
    278
    Détails du profil
    Informations personnelles :
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations forums :
    Inscription : Février 2009
    Messages : 278
    Points : 284
    Points
    284
    Par défaut
    Je pense qu'il veut parler du faite que google prédit les requêtes d'un utilisateur en fonction de ses demandes passés, ce qui implique que les réponses à une demande sont de plus en plus orienté vers une direction qui dépend des précédentes requêtes et enferme donc l'utilisateur dans une sorte de bulle.

    Enfin si ce n'était pas l'idée, c'est en tout cas la mienne

  6. #6
    Membre émérite

    Homme Profil pro
    Software Developer
    Inscrit en
    Mars 2008
    Messages
    1 470
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Software Developer

    Informations forums :
    Inscription : Mars 2008
    Messages : 1 470
    Points : 2 372
    Points
    2 372
    Par défaut
    Citation Envoyé par shadypierre Voir le message
    Je pense qu'il veut parler du faite que google prédit les requêtes d'un utilisateur en fonction de ses demandes passés, ce qui implique que les réponses à une demande sont de plus en plus orienté vers une direction qui dépend des précédentes requêtes et enferme donc l'utilisateur dans une sorte de bulle.

    Enfin si ce n'était pas l'idée, c'est en tout cas la mienne

    Mais l'article ne spécifie pas (du moins je ne vois pas) que c'est par rapport a l'historique des mots-clé de l'utilisateur, donc j'imagine que c'est par rapport aux recherches globales de tout le monde mélangé, sans aucune référence a la personne.
    Par exemple lorsque je développe et que j'écris les 2-3 premiers mots de mon erreur que je rencontre pour la premiere fois alors Google me pré-remplie le message complet.
    Sinon l'intéret est limité si ca ne vérifie que l'historique de l'utilisateur car en général on recherche rarement la meme chose ou sinon on garde le résultat désiré en favoris.

    Donc si j'ai bien compris et que mon raisonement est bon alors je ne penses pas que cela crée une dépendance de l'utilisateur.

  7. #7
    Rédacteur

    Avatar de Torgar
    Homme Profil pro
    Développeur Web
    Inscrit en
    Août 2007
    Messages
    2 334
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Août 2007
    Messages : 2 334
    Points : 8 040
    Points
    8 040
    Par défaut
    Petite précision, je cite : son implémentation de la recherche vocale utilise principalement des données provenant des requêtes anonymes sur Google.com pour créer un modèle de langue important

    En aucun cas il n'est fait mention que ce sont les recherches de l'utilisateur courant qui servent à la prédiction. Sinon comment pourrions nous avoir des prédictions (ça fait un peu Minority Report ) sur des termes que nous n'avons jamais utilisé ?

  8. #8
    Membre émérite

    Homme Profil pro
    Software Developer
    Inscrit en
    Mars 2008
    Messages
    1 470
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Software Developer

    Informations forums :
    Inscription : Mars 2008
    Messages : 1 470
    Points : 2 372
    Points
    2 372
    Par défaut
    Citation Envoyé par Torgar Voir le message
    Petite précision, je cite : son implémentation de la recherche vocale utilise principalement des données provenant des requêtes anonymes sur Google.com pour créer un modèle de langue important

    En aucun cas il n'est fait mention que ce sont les recherches de l'utilisateur courant qui servent à la prédiction. Sinon comment pourrions nous avoir des prédictions (ça fait un peu Minority Report ) sur des termes que nous n'avons jamais utilisé ?
    Merci je ne suis pas fou

    Par contre il est évident que Google conserve tout ce que fait l'utilisateur et le lie a celui-ci, mais dans ce service ce n'est pas vraiment utile justement.

  9. #9
    Invité
    Invité(e)
    Par défaut
    Bonjour,

    Je ne comprends pas bien le rapport entre "recherche vocale" et prédiction du mot suivant. En tout cas qu'est-ce que ça a de spécifique à la recherche vocale ? Si quelqu'un pouvait m'éclairer, ce serait sympas. Mon incompréhension provient sûrement du fait que je n'ai jamais utilisé la recherche vocale Google.

    Merci.

  10. #10
    LLB
    LLB est déconnecté
    Membre expérimenté
    Inscrit en
    Mars 2002
    Messages
    968
    Détails du profil
    Informations forums :
    Inscription : Mars 2002
    Messages : 968
    Points : 1 412
    Points
    1 412
    Par défaut
    En gros, la reconnaissance vocale est difficile et ça marche mal. Selon la qualité de l'enregistrement, la prononciation, la vitesse de parole, l'accent, etc. il y a beaucoup de différences. Un système n'utilisant que l'information du fichier son est voué à l'échec. Il y a beaucoup d'ambiguïtés dans la langue (dans ma phrase précédente : "les chèques" ou "l'échec" ?). Même dans la vie courante, on n'entend pas forcément chacune des syllabes de la phrase, mais on les devine avec le contexte.

    Pour faire la transcription, il faut avoir connaissance de la langue en question. L'article indique :

    Two such data sources are the anonymized queries on google.com and the web itself. They help improve automatic speech recognition through large language models: Voice Search makes use of the former, whereas YouTube speech transcription benefits significantly from the latter.
    En gros, dans une vidéo youtube, des phrases complètes sont prononcées. Cela ressemble donc (statistiquement) aux phrases que l'on trouve dans les articles, sur Internet. Ici, on parle de la recherche vocale. Quand on fait une recherche, on fait rarement une phrase complète. La recherche vocale s'appuie donc sur les requêtes qui sont faites dans les recherches classiques. Ça marche pas trop mal, puisque beaucoup de gens font les mêmes requêtes (j'imagine que le taux d'échec est important pour les requêtes complexes ou inhabituelles). Quand tu dictes deux mots-clés, il y a souvent un lien entre les deux mots : le mot recette est souvent accompagné d'un nom de plat ou de gâteau, par exemple.

  11. #11
    Invité
    Invité(e)
    Par défaut
    Ok merci pour l'éclaircissement .

  12. #12
    Membre expert
    Avatar de MarieKisSlaJoue
    Homme Profil pro
    Ingénieur Cloud
    Inscrit en
    Mai 2012
    Messages
    1 145
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Roumanie

    Informations professionnelles :
    Activité : Ingénieur Cloud
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2012
    Messages : 1 145
    Points : 3 657
    Points
    3 657
    Billets dans le blog
    20
    Par défaut
    En parlant de google. Quelqu'un sais pourquoi tous ses service son down ?

  13. #13
    Membre à l'essai
    Profil pro
    Inscrit en
    Novembre 2008
    Messages
    6
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2008
    Messages : 6
    Points : 14
    Points
    14
    Par défaut Exemple
    Si google entend
    "Recette EN ateau"
    Il dira recette en bateau
    Pour "recette DE ateau"
    Il dira pas recette de rateau ni chateau

    Il avait exclu "ateau" car ce mot ne fait pas partie de son dictionnaire étendu
    Il excluera recette de rateau car ça n est pas dans son dictionnaire de
    phrases, sauf peut etre si la valeur de parfaite diction est tres élevée (google a bien entendu) et que google pense donc ne pas avoir besoin de recourir au dictionnaire de phrases
    Ceci rétond a des inquietudes des massages précedents

Discussions similaires

  1. Réponses: 10
    Dernier message: 31/03/2014, 17h21
  2. Google I/O: Google Now, la recherche vocale désormais disponible sur PC
    Par Stéphane le calme dans le forum Actualités
    Réponses: 5
    Dernier message: 29/03/2014, 19h05
  3. Réponses: 1
    Dernier message: 21/11/2011, 14h53
  4. Google dévoile "+1", son service de recherche sociale
    Par Katleen Erna dans le forum Actualités
    Réponses: 6
    Dernier message: 01/04/2011, 08h14
  5. Clic sur bouton recherche google
    Par lostsoul dans le forum Général Java
    Réponses: 2
    Dernier message: 05/06/2009, 12h19

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo