2月14日,Facebook人工智能研究所(FAIR)宣布,其自研的ELF OpenGo训练模型和代码已经开源。
据悉,ELF OpenGo是基于著名人工智能围棋AlphaGoZero/AlphaZero做出的开源计算机围棋程序, 其最终模型是2000万局自我对弈训练的结果,水平稳超人类。ELF OpenGo的最新版本使用2000块GPU训练15天后,在只有一块GPU的情况下,与4个排名前30的人类职业选手进行比赛时,取得了20:0全胜的战绩,比赛过程中人类棋手没有时间限制。
研究人员在对ELF OpenGo训练的过程中,取得了三方面的突破:一是为ELF OpenGo训练了一个超人类棋艺的模型,他们在2000个GPU上运行类似AlphaZero风格的训练软件9天后,有20个模块的模型超越了人类水平;二是提供了模型在训练过程中的行为分析,包括和其他模型的对比、学习速度、学习难度,等等;三是实施ablation实验,以便研究AlphaZero风格算法的性质,通过比较AlphaGoZero和AlphaZero的训练过程,研究人员发现,即使对于最终模型而言,在对弈中将rollout加倍依然能将其棋力提升大约200 ELO,这说明AI的棋力会受到模型容量的限制。
来源:镁客网
-------------------------------------
分享才是真的美!
本文内容均来自互联网,版权属于原作者。如不慎侵害的您的相关权益,请联系我们,我们将尽快删除。
*点击屏幕右上角按钮,;
*可以通过通讯录右上角图标,,搜索机器人技术与应用;
*或输入:robotmagazine
领取专属 10元无门槛券
私享最新 技术干货