Précédent   Forum du club des développeurs et IT Pro > Le club des professionnels en informatique > Actualités
Actualités L'actualité des sociétés du secteur informatique
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Actualité déjà publiée
 
Outils de la discussion
Publicité
'
Vieux 01/11/2012, 15h45   #1
Hinault Romaric
Responsable Actualités

 
Avatar de Hinault Romaric
 
Homme Hinault Romaric
Consultant
Inscription : janvier 2007
Messages : 2 833
Détails du profil
Informations personnelles :
Nom : Homme Hinault Romaric
Localisation : Cameroun

Informations professionnelles :
Activité : Consultant
Secteur : High Tech - Éditeur de logiciels

Informations forums :
Inscription : janvier 2007
Messages : 2 833
Points : 37 590
Points : 37 590
Par défaut Google dévoile quelques secrets sur la recherche vocale

Google dévoile quelques secrets sur la recherche vocale
la précision du système extrêmement liée à la quantité de données

Google Research, la division de recherche de Google a publié un document qui décrit un peu comment sa technologie de recherche vocale fonctionne.

Les mécanismes qui sont développés au sein de ses applications de reconnaissance vocale reposent essentiellement sur les données.

En effet, les chercheurs ont constaté que la présence des quantités de données énormes entraine moins d’erreurs lors de la prédiction du mot suivant en fonction des mots qui le précèdent.

Selon l’article publié par Google, son implémentation de la recherche vocale utilise principalement des données provenant des requêtes anonymes sur Google.com pour créer un modèle de langue important, qui permet d’assigner la probabilité du mot suivant dans une phrase en fonction des mots précédents.

Le chercheur Ciprian Chelba de Google, explique que si par exemple, les mots précédents sont « New York », le modèle de langue attribuera une plus grande probabilité à « pizza » par rapport à « granola ».

Dans leurs analyses, les chercheurs de Google ont utilisé plus de 230 milliards de mots d’un échantillon aléatoire de requêtes anonymes du moteur Google qui ne déclenchent pas une correction orthographique.

Ceux-ci ont constaté qu’avec un tel ensemble de données, le taux d’erreur pouvait être réduit de 6 à 10 %, et pour les systèmes disposant d’un échantillon encore plus large, la réduction du taux d’erreur pouvait être de 17 à 52%.

Google dévoile ce document pratiquement au même moment que sort une mise à jour de son application de recherche pour iOS, dont la nouveauté la plus mise en avant est l’amélioration de la recherche vocale.


Source : Blog Google Research
__________________
Si déboguer est l’art de corriger les bugs, alors programmer est l’art d’en faire
Mon blog Mes articles
En posant correctement votre problème, on trouve la moitié de la solution
Hinault Romaric est déconnecté   Envoyer un message privé Réponse avec citation 30
Vieux 01/11/2012, 21h31   #2
alex_vino
Membre Expert
 
Homme Gilles Vino
Software Developer
Inscription : mars 2008
Messages : 1 311
Détails du profil
Informations personnelles :
Nom : Homme Gilles Vino
Localisation : Royaume-Uni

Informations professionnelles :
Activité : Software Developer

Informations forums :
Inscription : mars 2008
Messages : 1 311
Points : 2 311
Points : 2 311
La quantité de données et la puissance de traitement qu'il faut derriere, le tout pour des résultats quasi-instantanés...
Ce doit etre intéressant de voir tout ca de l'intérieur.
alex_vino est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/11/2012, 09h58   #3
Freem
Expert Confirmé
 
Homme
Développeur informatique
Inscription : décembre 2008
Messages : 777
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Développeur informatique

Informations forums :
Inscription : décembre 2008
Messages : 777
Points : 2 812
Points : 2 812
Utiliser la "prédiction" statistique de ce que la requête de l'utilisateur pourrait être implique que google va enfermer encore plus ses utilisateur dans leur bulle...
Mais bon, les gens s'en moquent, je suppose.
Freem est déconnecté   Envoyer un message privé Réponse avec citation 23
Vieux 02/11/2012, 11h49   #4
alex_vino
Membre Expert
 
Homme Gilles Vino
Software Developer
Inscription : mars 2008
Messages : 1 311
Détails du profil
Informations personnelles :
Nom : Homme Gilles Vino
Localisation : Royaume-Uni

Informations professionnelles :
Activité : Software Developer

Informations forums :
Inscription : mars 2008
Messages : 1 311
Points : 2 311
Points : 2 311
Citation:
Envoyé par Freem Voir le message
Utiliser la "prédiction" statistique de ce que la requête de l'utilisateur pourrait être implique que google va enfermer encore plus ses utilisateur dans leur bulle...
Mais bon, les gens s'en moquent, je suppose.
Peux-tu développer ton raisonnement davantage s'il te plait?
Je ne penses pas que si Google sait prédire le mot suivant d'une requete implique que les utilisateurs restent attaché a Google. Mais tu as l'air de penser a autre chose.

Perso je regarde plutot l'aspect technique de la chose, de toute maniere j'ai supprimé toute trace des services Google de mon quotidien, comme quoi on peux vivre sans.
alex_vino est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/11/2012, 14h58   #5
shadypierre
Membre confirmé
 
Avatar de shadypierre
 
Inscription : février 2009
Messages : 262
Détails du profil
Informations personnelles :
Localisation : France, Loire Atlantique (Pays de la Loire)

Informations forums :
Inscription : février 2009
Messages : 262
Points : 207
Points : 207
Je pense qu'il veut parler du faite que google prédit les requêtes d'un utilisateur en fonction de ses demandes passés, ce qui implique que les réponses à une demande sont de plus en plus orienté vers une direction qui dépend des précédentes requêtes et enferme donc l'utilisateur dans une sorte de bulle.

Enfin si ce n'était pas l'idée, c'est en tout cas la mienne
shadypierre est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 02/11/2012, 15h29   #6
alex_vino
Membre Expert
 
Homme Gilles Vino
Software Developer
Inscription : mars 2008
Messages : 1 311
Détails du profil
Informations personnelles :
Nom : Homme Gilles Vino
Localisation : Royaume-Uni

Informations professionnelles :
Activité : Software Developer

Informations forums :
Inscription : mars 2008
Messages : 1 311
Points : 2 311
Points : 2 311
Citation:
Envoyé par shadypierre Voir le message
Je pense qu'il veut parler du faite que google prédit les requêtes d'un utilisateur en fonction de ses demandes passés, ce qui implique que les réponses à une demande sont de plus en plus orienté vers une direction qui dépend des précédentes requêtes et enferme donc l'utilisateur dans une sorte de bulle.

Enfin si ce n'était pas l'idée, c'est en tout cas la mienne

Mais l'article ne spécifie pas (du moins je ne vois pas) que c'est par rapport a l'historique des mots-clé de l'utilisateur, donc j'imagine que c'est par rapport aux recherches globales de tout le monde mélangé, sans aucune référence a la personne.
Par exemple lorsque je développe et que j'écris les 2-3 premiers mots de mon erreur que je rencontre pour la premiere fois alors Google me pré-remplie le message complet.
Sinon l'intéret est limité si ca ne vérifie que l'historique de l'utilisateur car en général on recherche rarement la meme chose ou sinon on garde le résultat désiré en favoris.

Donc si j'ai bien compris et que mon raisonement est bon alors je ne penses pas que cela crée une dépendance de l'utilisateur.
alex_vino est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 02/11/2012, 16h21   #7
Torgar
Rédacteur/Modérateur

 
Avatar de Torgar
 
Homme Jérémy .B.
Développeur Web
Inscription : août 2007
Messages : 1 792
Détails du profil
Informations personnelles :
Nom : Homme Jérémy .B.
Âge : 27
Localisation : France, Gard (Languedoc Roussillon)

Informations professionnelles :
Activité : Développeur Web
Secteur : Industrie

Informations forums :
Inscription : août 2007
Messages : 1 792
Points : 7 067
Points : 7 067
Envoyer un message via Skype™ à Torgar
Petite précision, je cite : son implémentation de la recherche vocale utilise principalement des données provenant des requêtes anonymes sur Google.com pour créer un modèle de langue important

En aucun cas il n'est fait mention que ce sont les recherches de l'utilisateur courant qui servent à la prédiction. Sinon comment pourrions nous avoir des prédictions (ça fait un peu Minority Report ) sur des termes que nous n'avons jamais utilisé ?
__________________
Je ne suis pas schizophrène, nous sommes unanime !!!

► Pensez à la balise code, au si c'est le cas et au à ceux qui vous ont aidé.
Vous souhaitez participer aux rubriques CSS et (X)HTML ? Contactez-nous !

Créer des colonnes de même hauteur en CSS
Glossaire CSS
Les bordures en CSS3
Les transitions en CSS3
Torgar est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 02/11/2012, 16h38   #8
alex_vino
Membre Expert
 
Homme Gilles Vino
Software Developer
Inscription : mars 2008
Messages : 1 311
Détails du profil
Informations personnelles :
Nom : Homme Gilles Vino
Localisation : Royaume-Uni

Informations professionnelles :
Activité : Software Developer

Informations forums :
Inscription : mars 2008
Messages : 1 311
Points : 2 311
Points : 2 311
Citation:
Envoyé par Torgar Voir le message
Petite précision, je cite : son implémentation de la recherche vocale utilise principalement des données provenant des requêtes anonymes sur Google.com pour créer un modèle de langue important

En aucun cas il n'est fait mention que ce sont les recherches de l'utilisateur courant qui servent à la prédiction. Sinon comment pourrions nous avoir des prédictions (ça fait un peu Minority Report ) sur des termes que nous n'avons jamais utilisé ?
Merci je ne suis pas fou

Par contre il est évident que Google conserve tout ce que fait l'utilisateur et le lie a celui-ci, mais dans ce service ce n'est pas vraiment utile justement.
alex_vino est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/11/2012, 13h43   #9
fredpeaks
Invité de passage
 
Inscription : novembre 2012
Messages : 3
Détails du profil
Informations forums :
Inscription : novembre 2012
Messages : 3
Points : 3
Points : 3
Bonjour,

Je ne comprends pas bien le rapport entre "recherche vocale" et prédiction du mot suivant. En tout cas qu'est-ce que ça a de spécifique à la recherche vocale ? Si quelqu'un pouvait m'éclairer, ce serait sympas. Mon incompréhension provient sûrement du fait que je n'ai jamais utilisé la recherche vocale Google.

Merci.
fredpeaks est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/11/2012, 21h35   #10
LLB
Membre Expert
 
Inscription : mars 2002
Messages : 962
Détails du profil
Informations forums :
Inscription : mars 2002
Messages : 962
Points : 1 149
Points : 1 149
En gros, la reconnaissance vocale est difficile et ça marche mal. Selon la qualité de l'enregistrement, la prononciation, la vitesse de parole, l'accent, etc. il y a beaucoup de différences. Un système n'utilisant que l'information du fichier son est voué à l'échec. Il y a beaucoup d'ambiguïtés dans la langue (dans ma phrase précédente : "les chèques" ou "l'échec" ?). Même dans la vie courante, on n'entend pas forcément chacune des syllabes de la phrase, mais on les devine avec le contexte.

Pour faire la transcription, il faut avoir connaissance de la langue en question. L'article indique :

Citation:
Two such data sources are the anonymized queries on google.com and the web itself. They help improve automatic speech recognition through large language models: Voice Search makes use of the former, whereas YouTube speech transcription benefits significantly from the latter.
En gros, dans une vidéo youtube, des phrases complètes sont prononcées. Cela ressemble donc (statistiquement) aux phrases que l'on trouve dans les articles, sur Internet. Ici, on parle de la recherche vocale. Quand on fait une recherche, on fait rarement une phrase complète. La recherche vocale s'appuie donc sur les requêtes qui sont faites dans les recherches classiques. Ça marche pas trop mal, puisque beaucoup de gens font les mêmes requêtes (j'imagine que le taux d'échec est important pour les requêtes complexes ou inhabituelles). Quand tu dictes deux mots-clés, il y a souvent un lien entre les deux mots : le mot recette est souvent accompagné d'un nom de plat ou de gâteau, par exemple.
LLB est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 05/11/2012, 19h57   #11
fredpeaks
Invité de passage
 
Inscription : novembre 2012
Messages : 3
Détails du profil
Informations forums :
Inscription : novembre 2012
Messages : 3
Points : 3
Points : 3
Ok merci pour l'éclaircissement .
fredpeaks est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 06/11/2012, 03h32   #12
MarieKisSlaJoue
Membre éclairé
 
Avatar de MarieKisSlaJoue
 
Homme
Développeur Java
Inscription : mai 2012
Messages : 191
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Développeur Java
Secteur : High Tech - Éditeur de logiciels

Informations forums :
Inscription : mai 2012
Messages : 191
Points : 357
Points : 357
Envoyer un message via Skype™ à MarieKisSlaJoue
En parlant de google. Quelqu'un sais pourquoi tous ses service son down ?
__________________
Ce post à été écrit par un panda
MarieKisSlaJoue est déconnecté   Envoyer un message privé Réponse avec citation 02
Vieux 08/11/2012, 07h09   #13
jeromef3
Candidat au titre de Membre du Club
 
Inscription : novembre 2008
Messages : 4
Détails du profil
Informations forums :
Inscription : novembre 2008
Messages : 4
Points : 10
Points : 10
Par défaut Exemple

Si google entend
"Recette EN ateau"
Il dira recette en bateau
Pour "recette DE ateau"
Il dira pas recette de rateau ni chateau

Il avait exclu "ateau" car ce mot ne fait pas partie de son dictionnaire étendu
Il excluera recette de rateau car ça n est pas dans son dictionnaire de
phrases, sauf peut etre si la valeur de parfaite diction est tres élevée (google a bien entendu) et que google pense donc ne pas avoir besoin de recourir au dictionnaire de phrases
Ceci rétond a des inquietudes des massages précedents
jeromef3 est déconnecté   Envoyer un message privé Réponse avec citation 01
Réponse Actualité déjà publiée
Outils de la discussion

Navigation rapide


Fuseau horaire GMT +2. Il est actuellement 11h09.


 
 
 
 
Partenaires

Hébergement Web