La qualité du modèle de reconnaissance je dirai plutôt.
J'avais utilisé Snowboy qui est entièrement hors ligne.
Même avec une bonne qualité de son (sans saturation), en étant dans un environnement sans bruit et proche du micro c'est de l'ordre de 30-40% de reconnaissance du mot clé (celui qui a été le plus entraîné).
Et puis quand on voit que des modèles sont en attente depuis plus de 8 mois alors qu'ils ont atteint le nombre d'échantillons demandés... C'est pas top pour créer de nouveaux mots du coup.
Après on peut utiliser Bing/Google ou autre et là on voit tout de suite la différence, je montais à 60-80% de reconnaissance, mais c'est en ligne.
Partager