Google dévoile quelques secrets sur la recherche vocale
la précision du système extrêmement liée à la quantité de données
Google Research, la division de recherche de Google a publié un document qui décrit un peu comment sa technologie de recherche vocale fonctionne.
Les mécanismes qui sont développés au sein de ses applications de reconnaissance vocale reposent essentiellement sur les données.
En effet, les chercheurs ont constaté que la présence des quantités de données énormes entraine moins d’erreurs lors de la prédiction du mot suivant en fonction des mots qui le précèdent.
Selon l’article publié par Google, son implémentation de la recherche vocale utilise principalement des données provenant des requêtes anonymes sur Google.com pour créer un modèle de langue important, qui permet d’assigner la probabilité du mot suivant dans une phrase en fonction des mots précédents.
Le chercheur Ciprian Chelba de Google, explique que si par exemple, les mots précédents sont « New York », le modèle de langue attribuera une plus grande probabilité à « pizza » par rapport à « granola ».
Dans leurs analyses, les chercheurs de Google ont utilisé plus de 230 milliards de mots d’un échantillon aléatoire de requêtes anonymes du moteur Google qui ne déclenchent pas une correction orthographique.
Ceux-ci ont constaté qu’avec un tel ensemble de données, le taux d’erreur pouvait être réduit de 6 à 10 %, et pour les systèmes disposant d’un échantillon encore plus large, la réduction du taux d’erreur pouvait être de 17 à 52%.
Google dévoile ce document pratiquement au même moment que sort une mise à jour de son application de recherche pour iOS, dont la nouveauté la plus mise en avant est l’amélioration de la recherche vocale.
Source : Blog Google Research
Partager