1 pièce(s) jointe(s)
Un prestataire de Google a divulgué plus de mille enregistrements vocaux de Google Assistant
Des tiers écoutent ce que vous dites à Google Home au motif de ce qu’il faut améliorer l'IA
D'après Google
Google Home est une famille d’enceintes connectées à Internet que la firme de Mountain View associe à un programme informatique qui leur confère de « l’intelligence. » Dans le jargon du milieu, on parle d’assistant personnel intelligent et, du côté de la firme de Mountain View, c’est l’application Google Assistant que l’on retrouve aussi sur les smartphones qui officie.
Dans le principe, l’assistant personnel associé à un appareil (enceinte connectée, smartphone) est conçu pour recueillir les commandes vocales émises par un utilisateur. Ces dernières sont transmises à un serveur distant qui les analyse et donne suite à la requête que l’utilisateur a formulée. Le processus d’enregistrement est lancé par une commande vocale dédiée, ce qui suppose que sans elle rien ne se passe.
La Fondation de radio-télévision néerlandaise a obtenu une dizaine de tels enregistrements d’un collaborateur de Google – un employé d’un sous-traitant de la firme de Mountain View – qui, pour faire montre de crédibilité, a présenté son contrat de travail. L’organisme de la radiodiffusion flamande VRT est, par le même biais, rentré en possession d’un millier de contenus audios.
Dans ses conditions d’utilisateur, la firme de Mountain View n’est pas explicite à ce propos, mais ce qu’il faut bien souligner certains enregistrements sont passés en revue par des opérateurs humains. Le collaborateur de Google qui a tenu a resté sous anonymat l’a fait savoir. « Il est important que les gens se rendent compte que des tiers écoutent ces contenus », dit-il.
Ce dernier reçoit de Google quelques centimes par enregistrement pour écrire ce qu’il entend. « Sur les extraits, vous pouvez entendre comment des gens demandent à Google Home de régler l'alarme ou de vérifier les heures d'ouverture d'un magasin. D'autres demandent à Google de jouer leur musique préférée ou posent une question ludique pour tester l'appareil. Mais selon l'employé de Google, il lui arrive parfois d'entendre des commandes vocales très personnelles, par exemple des hommes qui demandent à Google de chercher des contenus pornographiques.
L’employé rapporte qu’il arrive aussi que l'enceinte connectée de la firme de Mountain View enregistre sans mot clé d'activation (Ok Google). Résultat des courses : certains audios n’ont rien à voir avec des commandes vocales destinées aux systèmes de Google. Il dit avoir écouté une douzaine d’échanges du type querelles ou conversations intimes. « Je me souviens d'un long extrait dans lequel j'ai senti qu'il y avait de la violence physique, dans lequel quelqu'un était dans le besoin, avec beaucoup de bruits de fond », rapporte la Fondation de radio-télévision néerlandaise.
Google a riposté à ces développements via un un billet de blog qui classe la fuite comme une faille de sécurité occasionée par le sous-traitant. L'entreprise a expliqué que ce processus d'examen est nécessaire pour que ses produits fonctionnent bien dans plusieurs langues, ce, bien que le même processus existe pour les enregistrements en anglais.
« Nous travaillons avec des experts en langues du monde entier pour améliorer nos technologies de traitement de la parole. Nous nous appuyons sur des transcriptions faites à partir d'un petit nombre de clips audio. Ce travail est crucial pour le développement de la technologie qui rend possible des produits tels que l'assistant Google. Les experts en langues ne passent en revue qu'environ 0,2 % de tous les clips audio qui ne sonte pas liés à des données personnelles. Nous avons récemment appris que l'un de ces experts en langue aurait violé notre politique de sécurité des données en divulguant des clips audio en néerlandais. Nous enquêtons de façon active sur cette affaire et lorsque nous constatons une violation de notre politique, nous prenons des mesures rapides qui peuvent aller jusqu'à la résiliation de notre contrat avec le partenaire », a déclaré Google en réponse aux publications liées à ces développements.
Ces derniers ne sont pas sans faire penser à ceux qui concernent un concurrent direct de la firme de Mountain View dans la filière des assistants personnels vocaux – Amazon. Il y a peu, le géant mondial du commerce en ligne a confirmé qu’il conserve les enregistrements vocaux obtenus via Alexa tant que les utilisateurs ne les suppriment pas. L’entreprise constitue ainsi une base de données de contenus audios dans laquelle ses employés peuvent puiser. Derrière, il y a un travail d’écoute, de transcription et d’annotation qui est fait par ces derniers.
Comme Google, Amazon a indiqué que ces employés ne passent en revue qu’un très faible échantillon d’enregistrements vocaux Alexa. En sus, l’entreprise a fait savoir que ces employés n’ont pas directement accès aux informations permettant d’identifier la personne ou le compte dans le cadre de ce flux de travail. Amazon se veut claire sur ceci que les opérations de traitement de données sont menées avec le terme confidentialité comme maître mot.
« Nous prenons au sérieux la sécurité et la confidentialité des informations personnelles de nos clients. Nous n'annotons qu'un nombre extrêmement faible d'interactions provenant d'un ensemble aléatoire de clients afin d'améliorer l’expérience de nos clients. Par exemple, ces informations nous aident à former nos systèmes de reconnaissance vocale et de compréhension du langage naturel, afin qu'Alexa puisse mieux comprendre vos demandes, ou nous assurer que le service fonctionne au mieux pour tout le monde. Nous mettons en œuvre des garanties techniques et opérationnelles strictes et avons une politique de tolérance zéro envers les abus sur notre système. Dans ce cadre, les employés n'ont pas d'accès direct à des informations qui leur permettraient d'identifier une personne ou un compte. Nous traitons toutes les informations avec la plus grande confidentialité, utilisons l'authentification multifactorielle pour restreindre l'accès, le cryptage du service et les audits de notre environnement de contrôle pour le protéger, et les clients peuvent également supprimer leurs interactions vocales avec Alexa à tout moment », a répondu l’entreprise.
Source : Fondation de radio-télévision néerlandaise, Google
Et vous ?
:fleche: Qu’en pensez-vous ?
:fleche: Aviez-vous connaissance de ce que ces enregistrements sont écoutés à nouveau par des humains ?
:fleche: Cette approche est-elle d'une absolue nécessité en matière d'intelligence artificielle ?
Voir aussi :
:fleche: Amazon atteint 100 millions de vente d'appareils intégrant Alexa, son assistant vocal intelligent
:fleche: Amazon révèle que plus de 10 000 employés travaillent sur Alexa ainsi que sur les appareils Echo qu'il alimente
:fleche: Alexa, le système vocal intelligent d'Amazon compte environ 80 000 applications dans son Store, mais aucune de vraiment célèbre
1 pièce(s) jointe(s)
Un prestataire de Google a divulgué plus de mille enregistrements vocaux de Google Assistant
Un prestataire de Google a divulgué plus de mille enregistrements vocaux de Google Assistant
ce que déplore l'entreprise
Les technologies d’assistance vocale ont fait irruption dans nos vies depuis l’avènement de l’Internet des Objets (IdO) et se développent à une vitesse sans précédent. Mais, ce que beaucoup ignorent peut-être est que ce développement nécessite une atteinte à la politique de confidentialité des données que ces petits objets enregistrent. Google, Amazon, tout comme les autres entreprises qui développent des technologies d’assistance vocale estiment que pour assurer l’avancée de la technologie, les enregistrements audios des utilisateurs sont enregistrés et analysés par certains de leurs employés qu’ils appellent des experts en langue.
Cette semaine, un employé de Google, un employé parmi ceux que Google appelle des experts en langue, a permis au média belge VRT NWS d’avoir accès à plus d’un millier d’enregistrements vocaux enregistrés via l’assistant vocal Google Home des utilisateurs. Le média a ensuite réalisé une vidéo pour mettre en évidence la façon dont les données vocales et les transcriptions issues des enregistrements faits par l’assistant Google Home sont gérées. Mis à par ce fait, ce dernier a également laissé les journalistes de VRT NWS consulter le logiciel utilisé pour réviser ou analyser les enregistrements. Le rapport confirme ce que beaucoup de personnes savent déjà, mais n’y a-t-il pas de risque ?
VRT NWS a pu écouter plus de mille extraits enregistrés via Google Assistant. Dans ces enregistrements, le média estime avoir clairement pu entendre les adresses, ainsi que d’autres informations sensibles des utilisateurs. « Cela nous a facilité la tâche de trouver les personnes impliquées et de les confronter aux enregistrements audio », a déclaré le média. Bien sûr, Google, Amazon et Apple, avec son assistant vocal intelligent Siri, ont toujours insisté sur le fait « qu’ils ne sont pas intéressés par ce que vous dites, mais par la façon dont vous le dites ». Cependant, écouter les enregistrements est un rappel frappant du fait que tout ce que vous dites à un assistant vocal ou dans son voisinage est enregistré.
Selon les explications fournies à VRT NWS, Google sous-traite la tâche d’écoute à des professionnels externes. Ils se connectent à une partie sécurisée de l'outil contenant une liste des extraits audio à analyser. Environ trois sources auraient confirmé que c'est ainsi que Google fonctionne. La reconnaissance vocale génère automatiquement un script des enregistrements. Les employés doivent ensuite vérifier pour décrire l'extrait le plus fidèlement possible : s'agit-il d'une voix de femme, d'un homme ou d'un enfant ? Qu'est-ce qu’ils disent ? Ils écrivent et décrivent avec soin tout ce qu’ils entendent. Pour Google, ces descriptions améliorent constamment ses moteurs de recherche, ce qui entraîne de meilleures réactions aux commandes.
Savoir que des personnes travaillant pour Google écoutent indirectement de tels enregistrements soulève des questions sur la confidentialité. Le média belge a rapporté que pour éviter que des extraits soient automatiquement liés à un utilisateur, les employés qui sont chargés d’analyser les transcriptions sont déconnectés des informations de l'utilisateur. Ils suppriment le nom d'utilisateur et le remplacent par un numéro de série anonyme. Mais, d’après la vidéo qu'il a présentée, ce dernier estime qu'il n'est nul besoin d’être un spécialiste des fusées pour retrouver l'identité de quelqu'un. Il vous suffira d’écouter attentivement ce qui se dit, a-t-il expliqué.
De plus, rapporte-t-il, s’ils ne savent pas comment écrit, un mot, un extrait, un nom, etc., ces employés doivent rechercher chaque mot, adresse, nom personnel ou nom de société sur Google ou sur Facebook. De cette manière, ils découvrent souvent rapidement l'identité de la personne qui parle. Le média belge a indiqué qu’il a écouté « plus de mille extraits, dont 153 étaient des conversations qui n'auraient jamais dû être enregistrées et au cours desquelles la commande “OK Google” n'a clairement pas été donnée ». « Mais dès que quelqu'un dans le voisinage prononce un mot qui sonne un peu comme “OK Google”, Google Home commence à enregistrer », a confirmé VRT NWS.
Cela signifie logiquement que de nombreuses conversations sont enregistrées de manière non intentionnelle. L’assistant a enregistré par exemple des conversations dans la chambre à coucher, des conversations entre parents et enfants, mais aussi des appels professionnels qui contiennent de nombreuses informations jugées confidentielles. Des enregistrements erronés peuvent également se produire lorsque quelqu'un appuie sur le mauvais bouton de son téléphone ou donne une commande par inadvertance. Ces informations sont enregistrées et stockées et risqueraient inévitablement d’être divulguées à des pirates informatiques, des gouvernements ou des organes de presse belges. Il arrive également des moments où les enregistrements concernent des agressions ou d’autres types de violence.
« L'une de nos trois sources indépendantes a déclaré qu'il avait dû décrire un enregistrement dans lequel il avait entendu une femme en détresse définitive », a indiqué VRT NWS. Que sont censés faire les employés avec ces informations ? Aucune directive claire n’a été spécifiée concernant de tels cas. C'est une question d'éthique importante. Selon le média, les employés reçoivent uniquement des instructions spécifiques concernant les numéros de compte et les mots de passe. Celles-ci sont marquées comme des informations sensibles. Google n’est cependant pas resté indifférent face à cette divulgation qu’il a qualifiée comme une faille de sécurité grave.
« Nous venons d'apprendre qu'un de ces réviseurs de langue a violé nos politiques de sécurité des données en divulguant des données audio néerlandaises confidentielles », a déclaré Google. Selon un porte-parole de l’entreprise, « ce travail est d’une importance cruciale pour développer des technologies permettant de maintenir des produits tels que Google Assistant ». D’après les indications de Google, seulement 0,2 % de tous les extraits audios sont examinés par ses experts en langue. Il a également ajouté que les extraits sonores ne sont pas associés aux comptes d'utilisateur dans le cadre du processus de révision. Les réviseurs ne doivent pas transcrire les conversations en arrière-plan ni d'autres bruits, mais uniquement les extraits qui sont dirigés vers Google.
Néanmoins, pour certaines personnes, ces objets, malgré leur utilité très précieuse, se révèlent de plus en plus comme étant le dispositif d’espionnage le plus sophistiqué jamais conçu. « Le gouvernement, le FBI, la NSA et les autres agences de renseignement dans les autres pays du monde ne se sont pas encore rendu compte du potentiel de surveillance énorme qu’offrent ces objets, ou ils le sont déjà et attendent de trouver la bonne stratégie pour l’exploiter. Ce qui est sûr, personne ne devra faire confiance à Google, Apple ou n’importe qui d’autre pour garantir sa sécurité et sa vie privée et la confidentialité de ses données si le gouvernement venait à réclamer les enregistrements vocaux de leurs assistants intelligents », ont-ils déclaré.
Sources : VRT NWS, Google
Et vous ?
:fleche: Qu'en pensez-vous ?
Voir aussi
:fleche: Amazon confirme que les enregistrements vocaux des clients d'Alexa sont conservés pour toujours, tant qu'ils ne les suppriment pas manuellement
:fleche: Les travailleurs d'Amazon écoutent ce que vous dites à Alexa, son assistant vocal intelligent et en parlent dans un forum de discussion interne
:fleche: Project Alias « pirate » les enceintes connectées Amazon Echo et Google Home pour protéger la vie privée des utilisateurs
:fleche: Nest : la société est morte à Google I/O 2019, avec son écosystème, ses comptes, son pare-feu de confidentialité ; place maintenant à Google Nest