Des chercheurs ont créé un nouveau système qui peut traduire des pensées simples en parole
en utilisant l'IA et un synthétiseur de parole
En 2009, les chercheurs du laboratoire de recherche d'Intel à Pittsburgh avaient fait une déclaration assez surprenante. Ils s'attelaient à trouver des moyens de lire et d'utiliser les ondes du cerveau humain afin de contrôler divers appareils électroniques (ordinateurs, postes de télévision et téléphones mobiles). Leur méthode était d'implanter des puces Intel dans le cerveau des personnes (toutes volontaires, évidemment) afin de leur permettre de diriger les ondes émises par l'organe. Les scientifiques espéraient que la liberté apportée par ce type d'implant rencontrera le succès auprès du public. Avec ce système, plus besoin de chercher pendant des heures dans son sac ou dans sa poche pour retrouver son appareil.
Les chercheurs prédisaient également que l'humanité deviendra très paresseuse, avançant que les hommes seront fatigués d'utiliser leurs doigts pour interagir avec une interface (et seront donc soulagés de pouvoir les contrôler par la simple force de leur pensée). L'année dernière, Neuralink, une entreprise américaine de biotechnologie spécialisée en neuro-ingénierie, travaillait activement sur un projet qui vise à développer des neuroprothèses pouvant être utilisées comme des interfaces cerveau-machine à très haut débit afin de connecter le cerveau humain et des ordinateurs via des implants cybernétiques et de permettre à l’esprit humain de s’interfacer avec des gadgets et des programmes. À court terme, Neuralink a pour objectif de concevoir des dispositifs qui traiteraient initialement des maladies cérébrales et des lésions cérébrales graves. À long terme, la société projette de développer des technologies susceptibles d’améliorer les êtres humains, en s’inspirant notamment d’un concept de science-fiction appelé « Neural Lace ».
Récemment, une équipe de chercheurs basés à New York a été en mesure de reconstruire des mots en utilisant uniquement l'activité cérébrale, une innovation qui pourrait ouvrir la voie à des technologies contrôlées par le cerveau comme, par exemple, un téléphone intelligent qui peut traduire vos pensées en messages texte. Le Dr Nima Mesgarani, professeure agrégée à l'Université Columbia, a dirigé l'étude et a déclaré à Inverse qu'il voit un grand potentiel pour aider à rétablir la parole chez les personnes qui se rétablissent d'un AVC ou qui vivent avec la sclérose latérale amyotrophique. Plus tard, ce type de technologie pourrait également ouvrir la porte à des téléphones intelligents connectés au cerveau qui pourraient permettre aux utilisateurs d'envoyer des SMS en utilisant leur esprit, même si c'est encore loin d'être le cas. Les travaux de cette recherche ont été publiés dans la revue scientifique Scientific Reports.
« L'une des motivations de ce travail est pour des méthodes alternatives d'interaction homme-machine, telles qu'une interface possible entre un utilisateur et un smartphone. Cependant, c'est encore loin de la réalité, et pour l'instant, l'information qui peut être extraite par des méthodes non invasives n'est pas assez bonne pour une application d'interface parole cerveau-ordinateur », déclare Mesgarani. Pour mettre au point cette nouvelle technique, Mesgarani et son collègue, le Dr Ashesh Dinesh Mehta du Northwell Health Physician Partners Neuroscience Institute, ont commencé par examiner l'activité cérébrale des patients épileptiques pour leur étude. Ces patients avaient déjà des implants d'électrodes dans le cerveau pour surveiller les crises et Mesgarani et Mehta ont pu s'en servir pour recueillir des données pour leurs recherches.
Le duo a demandé aux participants volontaires d'écouter les conférenciers réciter les nombres entre zéro et neuf, puis d'enregistrer les signaux cérébraux de cette interaction. Ensuite, ils ont formé un réseau neuronal - un programme qui imite la structure des neurones dans le cerveau humain - pour reconnaître les schémas dans les signaux et les traduire en mots robotiques à l'aide d'un synthétiseur de parole.
« Pour faire progresser l'état de l'art en matière de neuroprothèse de la parole, nous avons combiné les récents progrès de l'apprentissage profond avec les dernières innovations des technologies de synthèse de la parole pour reconstruire la parole intelligible en position fermée à partir du cortex auditif humain. Nous avons étudié la dépendance de la précision de la reconstruction par rapport aux méthodes de régression linéaire et non linéaire (réseau neuronal profond) et la représentation acoustique utilisée comme cible de la reconstruction, y compris les paramètres du spectrogramme auditif et de synthèse vocale. De plus, nous avons comparé la précision de reconstruction à partir des gammes de basses et hautes fréquences neuronales », peut-on lire dans le résumé de l'article publié.
Les chercheurs ont précisé que les « résultats montrent qu'un modèle de réseau neuronal profond qui estime directement les paramètres d'un synthétiseur de parole à partir de toutes les fréquences neuronales atteint les scores subjectifs et objectifs les plus élevés sur une tâche de reconnaissance numérique, améliorant l'intelligibilité de 65 % par rapport à la méthode de base qui utilise la régression linéaire pour reconstruire le spectre auditif ».
Source : Nature
Et vous ?
Que pensez-vous des résultats de cette recherche ?
Voir aussi
Neuralink, le projet d'Elon Musk pour qu'un cerveau humain interagisse directement avec un PC et l'Homme fusionne avec l'IA, aberration ou fiction ?
SpiNNaker, le plus grand supercalculateur au monde émulant un cerveau humain a été mis en marche, une première depuis le début de sa construction
Angleterre : le développement d'un type agressif de cancer du cerveau a doublé, une étude suggère que l'usage des téléphones mobiles en est la cause
Partager