“跟着我左手右手一个慢动作”,李飞飞团队造可学习人类的机械臂

学习似乎是只有人类才具备的特殊技能,但最近,智能机器人似乎也开始向人类学习和讨教。

斯坦福大学李飞飞团队的研究人员最新开发的机械臂,可以学习人类展示的拾取物体等操作,而且更有趣的是,机器人可以同时学习多种经验。10 月 29 日该小组在瑞士苏黎世召开的机器人学习大会上展示了他们的机械臂。

图 | 研究人员调试机械臂(来源:斯坦福大学)

可以模仿人类动作的机器人

斯坦福大学研究人员训练和测试的机械臂基于两个框架,这两个框架一起运作可以帮助机械臂更快更容易地学会一些基础技能。其中 RoboTurk 框架可以让人们实时引导机械臂完成任务,这一引导可通过智能手机或浏览器实现。而 SURREAL 则通过同时运行多项经验学习来加速学习过程,这就允许机械臂同时学习多种任务。

“结合 RoboTurk 和 SURREAL,我们可以将从人类收集到的数据与大规模强化学习相结合,进而可以让机器人做更多事。”Mandlekar 说,他是开发框架研究团队的成员。

团队成员计算机科学博士生 Yuke Zhu 展示了如何通过他 iPhone 上面的 app 对系统进行操作。他可以通过挥动手机指导机械臂对周围环境进行交互和探索。但这往往需要大量的手臂挥动或大量数据。就像父母教孩子如何刷牙一样,人们可以对机械臂展示如何做特定任务。

图 | RoboTurk 可以对人类动作进行模仿(来源:机器人学习大会)

但这些教学并不是完美的,甚至有时指令会出错。此外,“人类在机器人教学方面绝不是最佳选择,”Zhu 说,“但目前这些经验是机器人教学不可或缺的一部分。”

更快的平行学习

这些试验无论是否失败,都为我们提供了宝贵的信息。通过 RoboTurk 手机的演示信息将为机器人提供背景知识,并启动它们的学习。而 SURREAL 则允许同时在全球范围内运行数以千计的模拟训练,以加速学习进程。

研究团队成员计算机科学博士生 Linxi Fan 说,“有了 SURREAL,我们希望能加快机器人与环境互动的过程。”这些框架大大增加了可供机器人学习的数据量。

图 | 人们可以通过网络连接对 RoboTurk 进行训练(来源:机器人学习大会)

“通过对两个框架的结合,我们提供了 AI 辅助的任务机制,通过这种机制可以让人们远离危险环境同时可以保持相似的任务执行水平。”博士后研究员 Animesh Garg 说,他参与了框架的开发。

该团队还设想机器人在未来将成为日常生活中不可或缺的一部分:帮助人们做家务,在制造过程中帮助执行重复的装配任务,或是完成可能对人类构成威胁的危险任务。

“你不用告诉机器人需要旋转 20 度向前伸展 10 分米,”Zhu 说,“你只需要告诉机器人你想要拿一个放在厨房的苹果。”