IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

OpenAI conçoit un algorithme basé sur l’IA qui permet à un robot d’imiter des tâches réalisées par des humains


Sujet :

Intelligence artificielle

  1. #1
    Chroniqueur Actualités

    Homme Profil pro
    Webmaster
    Inscrit en
    Janvier 2014
    Messages
    1 089
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Webmaster
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Janvier 2014
    Messages : 1 089
    Points : 26 554
    Points
    26 554
    Par défaut OpenAI conçoit un algorithme basé sur l’IA qui permet à un robot d’imiter des tâches réalisées par des humains
    OpenAI conçoit un algorithme basé sur l’IA qui permet à un robot d’imiter des tâches réalisées par des humains
    dans un environnement virtuel

    Dans le mois de décembre 2015, Elon Musk et plusieurs personnes et entreprises de l’industrie technologique ont joint leurs efforts pour annoncer la création d’OpenAI, une entreprise à but non lucratif ayant pour objectif de mettre à la disposition du monde entier les résultats des recherches dans le domaine de l’intelligence artificielle sans exiger de contrepartie financière.

    Lors de sa création, les fondateurs de l’entreprise expliquaient que leurs chercheurs « seront fortement encouragés à publier leurs travaux que ce soit sous forme de documents, de messages blog, de code, et nos brevets (le cas échéant) seront partagés avec le monde ». Quelques années se sont maintenant écoulées et il y a quelques jours, l’entreprise a annoncé la disponibilité d’un nouvel algorithme basé sur l’intelligence artificielle.

    En effet, depuis quelques jours, OpenAI a annoncé la disponibilité d’un framework permettant aux robots d’apprendre en imitant ce qui leur est donné de voir. Généralement, pour qu’un système puisse maîtriser les différentes facettes d’une tâche et l'exécuter sans problèmes, cela nécessite d’effectuer des tests d’apprentissage sur un large éventail d’échantillons. OpenAI a donc souhaité aller encore plus vite dans l’apprentissage en permettant aux robots d’apprendre comme le font les humains.

    Cela a donné naissance au framework d’apprentissage baptisé « one-shot imitation learning ». Avec cet algorithme, un humain peut communiquer à un robot comment réaliser une nouvelle tâche après l’avoir exécutée dans un environnement de réalité virtuelle. Et à partir « d’une seule démonstration, le robot est capable d'exécuter la même tâche à partir d’une configuration arbitraire de départ ».

    En principe, les politiques sont des tâches spécifiques, écrivent les chercheurs dans leur publication. Ainsi l’on peut construire une politique par l’apprentissage d’imitation ou de renforcement pour empiler des blocs dans des tours de 3 ou n éléments. Mais avec ce nouvel algorithme, les chercheurs sont parvenus à concevoir des politiques qui ne sont pas spécifiques à une tâche particulière, mais plutôt peuvent être utilisées par un robot pour savoir ce qu’il faut faire dans une nouvelle situation d’une tâche, comme lorsque les blocs sont rangés de manière aléatoire.


    Dans la vidéo ci-dessus, nous avons une démonstration de formation d’une politique qui résout une différente instance de la même tâche avec comme données d’apprentissage la simulation observée sur une autre démonstration.

    Pour empiler les blocs, le robot utilise un algorithme soutenu par deux réseaux neuronaux, à savoir un réseau de vision et un réseau d’imitation. Le réseau de vision acquiert les aptitudes souhaitées en enregistrant dans une tâche des centaines d’images simulées avec différentes perturbations d’éclairage, textures et objets. Le réseau d’imitation quant à lui observe une démonstration, la traite, déduit la trajectoire des objets déplacés et ensuite accomplit l’intention en commençant avec des blocs rangés différemment.

    En dessous du réseau d’imitation, nous avons un processus appelé « Soft attention » qui traite à la fois les différentes étapes et actions ainsi que les blocs appropriés à utiliser dans l’empilement et aussi les composants du vecteur spécifiant les emplacements des divers blocs dans l’environnement.

    Les chercheurs expliquent que pour que le robot puisse apprendre une politique robuste, une quantité modeste de bruit a été introduite dans les résultats de la politique de script. Ceci a permis au robot d’accomplir correctement sa tâche même lorsque les choses tournent mal. Sans l’injection de ce bruit, le robot n’aurait pas pu généraliser ce qu’il a appris par l’observation d’une tâche spécifique.

    Enfin, il faut savoir que bien que l’algorithme « one-shot imitation learning » ait été utilisé pour enseigner un robot à déplacer des blocs de cubes colorés, il peut être également utilisé pour d’autres tâches.

    Source : OpenAI, Télécharger le rapport des chercheurs (PDF)

    Et vous ?

    Que pensez-vous de ce nouvel algorithme basé sur l'IA ?

    Pourra-t-il se faire une place dans cet environnement ?

    Voir aussi

    Des ténors de l'IT créent une entreprise à but non lucratif dédiée à l'IA afin de mettre l'IA au service de l'humanité

    La Rubrique Algorithmique, Forum Intelligence Artificielle, Forum Cours et Tutoriels IA, FAQ Algorithmique
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  2. #2
    Expert éminent
    Avatar de Matthieu Vergne
    Homme Profil pro
    Consultant IT, chercheur IA indépendant
    Inscrit en
    Novembre 2011
    Messages
    2 264
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Consultant IT, chercheur IA indépendant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Novembre 2011
    Messages : 2 264
    Points : 7 760
    Points
    7 760
    Billets dans le blog
    3
    Par défaut
    Il semble que le lien vers le rapport des chercheurs soit invalide. Ça me donne un article sur la traduction de phrases et non l'alignement de blocs. A priori, le bon lien serait celui-ci :
    https://arxiv.org/abs/1703.07326
    Site perso
    Recommandations pour débattre sainement

    Références récurrentes :
    The Cambridge Handbook of Expertise and Expert Performance
    L’Art d’avoir toujours raison (ou ce qu'il faut éviter pour pas que je vous saute à la gorge {^_^})

  3. #3
    Membre habitué
    Profil pro
    Travail non informatique
    Inscrit en
    Décembre 2010
    Messages
    102
    Détails du profil
    Informations personnelles :
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Travail non informatique

    Informations forums :
    Inscription : Décembre 2010
    Messages : 102
    Points : 179
    Points
    179
    Par défaut Enfin de l'adaptabilité !
    Enfin de l'adaptabilité !
    C'est ce qui manquait aux machines pour nous dépasser.

Discussions similaires

  1. Réponses: 5
    Dernier message: 25/09/2015, 16h47
  2. Réponses: 7
    Dernier message: 27/11/2010, 22h06
  3. Réponses: 7
    Dernier message: 06/01/2010, 08h32
  4. requête sur des périodes délimitées par des dates
    Par gvdmoort dans le forum Requêtes
    Réponses: 1
    Dernier message: 12/10/2007, 12h09

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo