Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Chroniqueur Actualités

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    mars 2013
    Messages
    4 726
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : mars 2013
    Messages : 4 726
    Points : 123 065
    Points
    123 065
    Par défaut Une IA aide à compléter d'anciennes recherches scientifiques en révélant des connexions entre elles
    Une IA aide à compléter d'anciennes recherches scientifiques en révélant des connexions entre elles,
    qui auraient mené à des découvertes

    La majorité des connaissances scientifiques existent uniquement sous formes d'articles, et donc au format texte, ce qui rend difficile toute analyse globale. De ce fait, de nombreuses découvertes potentielles sont ratées, simplement parce qu'aucun être humain n'a su faire le lien entre deux découvertes séparées. Aussi, dans une étude publiée dans le magazine Nature la semaine dernière, des chercheurs du Lawrence Berkeley National Laboratory ont utilisé un algorithme appelé Word2Vec pour passer en revue les articles scientifiques afin de rechercher les connexions manquantes entre eux. Leur algorithme a été en mesure de proposer des matériaux en thermoélectricité ; utilisés pour convertir la chaleur en énergie ils sont embarqués dans de nombreuses applications de chauffage et de refroidissement.

    Pour rappel, l’effet thermoélectrique est un phénomène physique présent dans certains matériaux : il lie le flux de chaleur qui les traverse au courant électrique qui les parcourt. Cet effet est à la base d'applications, dont très majoritairement la thermométrie, puis la réfrigération (ex. module Peltier) et enfin, très marginalement, la génération d'électricité (par « thermopile » ou « calopile »). Un matériau thermoélectrique transforme directement la chaleur en électricité, ou déplace des calories par l'application d'un courant électrique.

    L’algorithme ne connaissait pas la définition de thermoélectricité. Il n'a reçu aucune « formation » en science de la matière. Cependant, en utilisant uniquement des associations de mots, l'algorithme a pu fournir une liste potentielle de futurs matériaux en thermoélectricité, dont certains pourraient être meilleurs que ceux que nous utilisons actuellement.

    « Il peut lire n'importe quel article sur la science des matériaux, ainsi peut créer des liens qu'aucun scientifique ne pourrait », a déclaré le chercheur Anubhav Jain. « Parfois, il fait ce qu'un chercheur ferait; d'autres fois, il procède à des associations multidisciplinaires ».

    Nom : intelligence.png
Affichages : 3064
Taille : 254,8 Ko

    Pour « former » l'algorithme, les chercheurs lui ont fait parcourir 3,3 millions de résumés d’articles scientifiques liés à la science des matériaux, aboutissant à un vocabulaire d'environ 500 000 mots. Word2vec s’est alors servi de l’apprentissage automatique pour analyser les relations entre les différents mots, en représentant chacun par un vecteur (d'où son nom "Word2Vec").

    « En formant un réseau de neurones sur un mot, vous obtenez des représentations de mots pouvant réellement transmettre des connaissances », a commenté Jain.

    En utilisant seulement les mots trouvés dans les résumés scientifiques, l’algorithme était capable de comprendre des concepts tels que le tableau périodique et la structure chimique des molécules. L'algorithme a lié les mots qu’il trouvait proches les uns aux autres, créant des vecteurs de mots apparentés permettant de définir les concepts. Dans certains cas, les mots étaient liés à des concepts de thermoélectricité mais n’avaient jamais été décrits la thermoélectricité comme un champ d’application dans les résumés analysés. Cette lacune dans les connaissances est difficile à détecter avec un œil humain, mais facile à détecter par un algorithme.

    Après avoir montré sa capacité à prédire les matériaux futurs, les chercheurs ont virtuellement fait remonter leurs travaux dans le temps. Ils ont mis au rebut les données récentes et testé l'algorithme sur d'anciennes publications scientifiques, en cherchant s'il pouvait prédire des découvertes scientifiques avant qu'elles ne se produisent. Encore une fois, l'algorithme a fonctionné.

    Les chercheurs ont donc retiré les articles récents et entraîné une nouvelle fois leur modèle sur 18 corps de textes différents, en limitant à chaque fois les textes à ceux publiés avant une année limite, entre 2001 et 2018. L'algorithme a, à chaque fois, donné cinq matériaux considérés comme les plus prometteurs pour une application thermoélectrique d'après les associations faites dans la littérature. Ils ont ainsi pu prédire la découverte de CuGaTe2, l'un des meilleurs matériaux thermoélectriques modernes, quatre ans avant sa première publication en 2012. Sur quatre autres matériaux mis en avant par l'IA sur la base des articles publiés avant 2009, deux n'ont été que suggérés dans la littérature que 8 ou 9 ans après les articles étudiés, tandis que deux autres n'ont jamais été testés.

    Cette nouvelle application de l’apprentissage automatique va au-delà de la science des matériaux. Comme il n’est pas formé sur un ensemble de données scientifiques spécifique, vous pouvez facilement l’appliquer à d’autres disciplines, en le recyclant à la littérature de la matière de votre choix. Vahe Tshitoyan, l’auteur principal de l’étude, indique que d’autres chercheurs ont déjà atteint le but recherché, souhaitant en apprendre davantage.

    « Cet algorithme n'est pas supervisé et construit ses propres connexions », a déclaré Tshitoyan. « Vous pouvez l'utiliser pour des travaux tels que la recherche médicale ou la découverte de médicaments. L'information est là-bas. Nous n’avons tout simplement pas encore établi ces liens, car vous ne pouvez pas lire tous les articles ».

    Source : Nature

    Et vous ?

    Qu'en pensez-vous ?

    Voir aussi :

    Intelligence artificielle : Bruno Le Maire précise la stratégie française et où vont aller les 1,5 milliard d'euros promis d'ici 2022
    Gen, un langage probabiliste universel dans Julia, il ambitionne de faciliter l'utilisation d'intelligence artificielle pour tous
    Salesforce annonce pour 15,7 milliards $ le rachat de Tableau, entreprise leader de la business intelligence et l'analytics
    Intelligence artificielle : Microsoft se démarque dans la pertinence technique et la couverture de marché, d'après un rapport d'IPlytics
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  2. #2
    Membre expérimenté

    Profil pro
    Inscrit en
    janvier 2014
    Messages
    731
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : janvier 2014
    Messages : 731
    Points : 1 667
    Points
    1 667
    Par défaut
    ça fait tout de même plaisir de lire de temps en temps des exemples de techno qui oeuvrent pour l'avancée, et non pour les dérives.
    Je suppose que les chercheurs ont enfin là un outil permettant de soutenir leur demande de budget en disant : "Regardez, c'est prometteur, on y est presque !"
    Pensez à utiliser les pouces d’appréciation, pour participer à la visibilité de l'apport d'un propos, ou l'intérêt que vous y prêtez... qu'il soit positif ou négatif.

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    février 2010
    Messages
    23
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : février 2010
    Messages : 23
    Points : 22
    Points
    22
    Par défaut Aucune surprise
    Simplement un graphe qui pourrait être issu d'une PCA avec le nombre de mots selon la loi de ZIPF ou l'inverse de la fréquence.. Quelle découverte

  4. #4
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    novembre 2010
    Messages
    2 832
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : novembre 2010
    Messages : 2 832
    Points : 7 782
    Points
    7 782
    Par défaut
    d'autant que Word2Vec existe depuis au moins 6 ans
    Avant donc que d'écrire, apprenez à penser.
    Selon que notre idée est plus ou moins obscure, l'expression la suit, ou moins nette, ou plus pure.
    Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément.
                                                        - Nicolas Boileau, L'Art poétique

Discussions similaires

  1. [BI4] Recherche formule pour comparer les lignes entre elles
    Par GTime dans le forum Webi
    Réponses: 1
    Dernier message: 24/10/2018, 14h14
  2. Réponses: 4
    Dernier message: 02/09/2008, 21h57
  3. Aide pour l'instruction rechercher
    Par secondechance dans le forum Débuter
    Réponses: 5
    Dernier message: 14/05/2008, 21h16
  4. [VBA-E] Aide sur la fonction recherche
    Par Didpa dans le forum Macros et VBA Excel
    Réponses: 18
    Dernier message: 08/08/2006, 07h58

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo