通过使用OpenAI开发的新型神经网络,这只机械手能够学习如何自行解决魔方问题。
您可以单手解决魔方问题吗?上图这只神奇魔方机械手归便是人工智能研究公司OpenAI所做的工作。据设计新闻10月22日报道,通过使用神经网络的组合,OpenAI开发了一个系统,借助该系统,机械手会教自己学习魔方的原理,然后再进行操作。
乍一看,很容易想像OpenAI会通过使用复杂的软硬件来解决魔方问题。而实际上,OpenAI通过使用较旧的硬件(使用的机器人手已使用约15年)和创新的软件方法来实现这一目标。OpenAI并非简单地编程机械手来解决魔方问题,而是使用神经网络通过仿真来训练机器人,然后将其移植到物理机械手中。在运行大量仿真运算的过程中(相当于OpenAI在现实世界中玩了1000年的魔方),AI能够学习求解魔方的规则并制定用于执行的策略。
OpenAI早在2017年就实现了用AI解决魔方问题,但这完全是在仿真环境中完成的。为了将相同的技能转移到现实世界中,AI需要考虑现实世界的复杂因素(例如魔方的重量,旋转的摩擦和魔方的弹性等),而所有这些因素实际上都不存在于虚拟环境中。
魔方问题的实际求解过程中,OpenAI把强化学习和二阶段算法(Kociemba's algorithm)结合起来使用。顺便说一下,二阶段算法是人类用来解决魔方问题的一种快算法。本质上讲,上述机制就是一个不断尝试、奖励、反馈,直至形成最终解决方案的过程。
为了更进一步实现与现实世界的统一,研究人员创建了一种称为自动域随机化(ADR)的新算法,该算法可以在虚拟环境中自动调整随机变量。每次AI解决难题后,ADR都会通过更改环境变量,使下一个难题变得更加棘手(诸如改变魔方的质量,摩擦系数和表面材料之类的参数),迫使AI进行下一轮学习,以达到解决问题的性能阈值。
领取专属 10元无门槛券
私享最新 技术干货