Au sous-sol du Gates Computer Science Building de l’Université Stanford, un écran fixé à un bras robotique rouge s’allume. Une paire d’yeux de dessin animé cligne des yeux. “Rencontrez Bender “, dit Ajay Mandlekar, étudiant au doctorat en génie électrique.
Bender est l’un des bras robotiques qu’une équipe de chercheurs de Stanford utilise pour tester deux cadres qui, ensemble, pourraient rendre l’enseignement des compétences de base des robots plus rapide et plus facile. Le framework RoboTurk permet de diriger les bras du robot en temps réel avec un smartphone et un navigateur en montrant au robot comment effectuer des tâches comme ramasser des objets. SURREAL accélère le processus d’apprentissage en exécutant plusieurs expériences à la fois, ce qui permet essentiellement aux robots d’apprendre de plusieurs expériences simultanément.
“Avec RoboTurk et SURREAL, nous pouvons repousser les limites de ce que les robots peuvent faire en combinant de nombreuses données collectées par les humains et en les couplant avec un apprentissage de renforcement à grande échelle “, a déclaré Mandlekar, membre de l’équipe qui a développé les cadres.
Les humains enseignent aux robots
Yuke Zhu, doctorant en informatique et membre de l’équipe, a montré comment le système fonctionne en ouvrant l’application sur son iPhone et en l’agitant dans les airs. Il a guidé le bras du robot — comme une grue mécanique dans un jeu d’arcade — pour planer au-dessus de son prix : un bloc de bois peint en forme de steak. Il s’agit d’une tâche simple qui consiste à identifier les objets, à les ramasser et à les mettre dans le bac avec l’étiquette appropriée.
Pour les humains, la tâche semble ridiculement facile. Mais pour les robots d’aujourd’hui, c’est assez difficile. Les robots apprennent généralement en interagissant avec leur environnement et en l’explorant – ce qui se traduit généralement par de nombreux mouvements aléatoires du bras – ou à partir de grands ensembles de données. Ni l’un ni l’autre n’est aussi efficace que d’obtenir de l’aide humaine. De la même façon que les parents apprennent à leurs enfants à se brosser les dents en guidant leurs mains, les gens peuvent montrer aux robots comment effectuer des tâches spécifiques.
Cependant, ces leçons ne sont pas toujours parfaites. Lorsque Zhu a appuyé fort sur l’écran de son téléphone et que le robot a relâché sa prise, le steak de bois a frappé le bord de la poubelle et a cliqué sur la table. “Les humains ne sont pas du tout optimaux dans ce domaine, mais cette expérience fait toujours partie intégrante de l’expérience des robots”, a dit M. Mandlekar.
Un apprentissage plus rapide en parallèle
Ces essais – même les échecs – fournissent des informations inestimables. Les démonstrations recueillies par le biais de RoboTurk donneront aux robots des connaissances de base pour donner le coup d’envoi de leur apprentissage. SURREAL peut exécuter des milliers d’expériences simulées par des personnes du monde entier à la fois pour accélérer le processus d’apprentissage.
“Avec SURREAL, nous voulons accélérer ce processus d’interaction avec l’environnement “, déclare Linxi Fan, doctorante en informatique et membre de l’équipe. Ces frameworks augmentent considérablement la quantité de données dont les robots peuvent tirer des leçons.
“Les deux cadres combinés peuvent fournir un mécanisme pour l’exécution de tâches assistées par l’IA où nous pouvons éloigner les humains d’environnements dangereux tout en conservant un niveau similaire de compétence dans l’exécution des tâches “, a déclaré Animesh Garg, chercheur postdoctoral et membre de l’équipe qui a élaboré les cadres.
L’équipe prévoit que les robots feront partie intégrante de la vie quotidienne à l’avenir : aider aux tâches ménagères, effectuer des tâches d’assemblage répétitives dans la fabrication ou effectuer des tâches dangereuses qui peuvent représenter une menace pour les humains.
“Vous ne devriez pas avoir à dire au robot de tourner son bras de 20 degrés et d’avancer de 10 centimètres “, dit Zhu. “Tu veux pouvoir dire au robot d’aller à la cuisine chercher une pomme.”
Source :
Matériel fourni par l’Université de Stanford