人类会在行动之前预判他们的行动轨迹。例如,如果一个人要踢球,他们可能想知道球在哪里,他们会根据需要移动到球的新位置。机器人(特别是那些没有配备高级人工智能的机器人)通常无法做到这一点,因为它们通常被编程来执行简单的任务。
加州大学伯克利分校的一个研究小组已经确定,让机器人可以有这种感知能力。为了证明这一点,他们开发了一种新的机器人学习技术,使机器人能够提前思考,以“弄清楚如何操作他们从未遇到过的物体”。
这个团队已经把这种技术称为“视觉预见”——但它不能给机器人预测未来的能力。
伯克利分校的研究人员将这项技术应用到名为“Vestri”的机器人上,使其能够预测未来几秒钟内的摄像头将会看到什么。通过新的远见,Vestri展示了在桌子上移动小物件的能力,而不需要触碰或撞倒附近的障碍物。然而,最令人印象深刻的是,这项技术使得机器人能够在没有人的输入、监督或之前的物理知识的情况下完成小任务。
“以同样的方式,我们可以想象我们的行动将移动物体在我们的环境中,这种方法可以使一个机器人可视化不同的行为将如何影响周围的世界,”解释谢尔盖·莱文伯克利分校助理教授的电气工程和计算机科学系的——背后的实验室技术的发展。“这可以在复杂的现实环境中实现高度灵活的智能规划。”
视觉预测是基于“卷积反复的视频预测”,即动态神经平流(DNA)。根据该团队的研究,基于DNA的模型能够预测图像中的像素如何根据机器人的行为从一个帧移动到另一个帧。作为Levine实验室的一名博士生,同时也是原始DNA模型的发明者的切尔西·芬恩(Chelsea Finn)解释说,像Vestri这样的机器人现在可以“完全依靠自己学习一系列的视觉对象操作技能”。
弗雷德里克·埃伯特(Frederik Ebert)是Levine实验室的一名研究生,他参与了这个项目,将他们的工作与机器人的工作进行了比较,以使人类学会与环境中的物体进行互动:
Ebert说:“人类在一生中通过与各种各样的物体互动,而没有任何老师来学习对象操纵技能。”“我们已经证明,建立一个机器人系统,也可以利用大量的自主收集的数据来学习广泛适用的操作技巧,特别是对象推动技能。”
Levine注意到,Vestri的功能仍然有限,不过正在做更多的工作以提高视觉的预见性。有一天,该技术可以用来帮助自动驾驶汽车上路,更好地装备它们来处理新的情况和陌生的物体。
在此之前,这项技术需要各种改进,比如更精细的视频预测和收集更具体视频数据的方法。在这些改进之后,机器人可以执行更复杂的任务,如升降、放置物体或处理柔软易变形的物体,如布或绳子。也许有一天你甚至不需要自己叠衣服——你的机器人助手可以帮你洗衣服。
领取专属 10元无门槛券
私享最新 技术干货