使用OpenAI开发的新型神经网络,这只机械手能够学习如何自行解决魔方。
您可以单手解决魔方吗?这只机械手可以归功于人工智能研究公司OpenAI所做的工作。据设计新闻10月22日报道,通过使用神经网络的组合,OpenAI开发了一个系统,借助该系统,机械手会教自己解立方体的原理,然后再进行操作。这项研究的结果发表在一纸由OpenAI释放。
乍一看,很容易想像OpenAI通过使用复杂的硬件和一些易于使用的软件来解决Rubik's Cube而实现了这一目标。实际上,这是通过使用较旧的硬件(使用的机器人手已使用约15年)和创新的软件方法来实现的。OpenAI并非简单地编程机械手来解决魔方,而是使用神经网络通过仿真来训练机器人,然后将其移植到物理机械手中。在运行大量仿真的过程中(OpenAI称使用Rubik's Cube约有1000年的历史),AI能够学习求解立方体的规则并制定用于执行立方体的策略。
OpenAI早在2017年就实现了AI解决Rubik's Cube的首次成功,但这完全是在仿真中完成的。为了将相同的技能转移到现实世界中,AI需要考虑现实世界的因素(例如重量,摩擦和弹性),而所有这些因素实际上都不存在于虚拟环境中。
立方体的实际求解是通过结合强化学习和通过使用Kociemba算法训练AI来处理的,该算法是人类用来尽快解决Rubik立方体的算法。从本质上讲,人工智能试图一次又一次地解决一个多维数据集,并且每次做出正确的举动或提出解决方案时都会得到奖励。
为了更进一步,并与现实世界形成更多的平衡,研究人员创建了一种称为自动域随机化(ADR)的新算法,该算法可以在虚拟环境中自动调整随机变量。每次AI解决难题时,ADR都会通过更改环境使下一个难题变得更加困难。诸如立方体的质量,摩擦和表面材料之类的参数都被逐渐随机化以使任务更加艰巨。这样做迫使AI进行学习,使其能够根据现实世界的要求不断进行调整。
领取专属 10元无门槛券
私享最新 技术干货