棋盘游戏,人类没有机会抗击人工智能
“即使我排名第一,我也不是最高的,”韩国围棋冠军李·塞多尔说。去年,创建AlphaGo(在2016年将Lee击败四场比赛的算法)的同一个团队庆祝了更强大的事情:一个能够自学并在三场不同比赛中获胜的人工智能系统。人工智能是一个网络,但可用于多种游戏。这种通用性使其更令人印象深刻,因为它也可能也能够学习其他类似的游戏。
他们称其为AlphaZero,并且知道国际象棋,将棋(被称为日本象棋)和Go(棋盘游戏),一种复杂的棋盘游戏,黑白石头在大网格上对峙。所有这些游戏都属于“完整信息”或“完美信息”竞赛类别-每个玩家都可以看到整个棋盘,并可以访问相同的信息。例如,这与扑克游戏不同,在扑克游戏中,您不知道对手持有哪些牌。
创建它的DeepMind的软件工程师Julian Schrittwieser说:“ AlphaZero只是通过与自己竞争来完全学习自己。” “我们得到的是不被人传统上是如何玩游戏影响了游戏的一个完全新的看法。” Schrittwieser是在2018年合着的研究在科学描述AlphaZero,这是首次公布于2017年。
由于AlphaZero比可以在Go上赢得比赛的AI“更具通用性”,“它暗示我们有很好的机会将其扩展到甚至可能要解决的更多实际问题上稍后,” Schrittwieser说。
首先需要告知网络游戏规则,然后再通过与自己对战来学习。围棋的训练花费了13天,而国际象棋仅花费了9个小时。在那之后,很快就击败了那些已经是那些游戏专家的计算机程序。例如,在Shogi,AlphaZero仅花了两个小时就开始击败另一个名为Elmo的程序。实际上,在博客文章中,DeepMind宣称AI是国际象棋,将棋和围棋的“历史上最强大的玩家”。Schrittwieser说,这种相同的算法可以用来玩其他“完全信息”游戏,例如十六进制游戏,“没有问题”。
新的AI类似于2016年击败李·塞多尔(Lee Sedol)的人工智能系统。夺冠的比赛是一部出色的纪录片的主题,该纪录片目前在Netflix上播出,名为AlphaGo。值得一提的是,AI领域还是人们所感兴趣的,或者是否是令人着迷的古老Go语言游戏。
IBM Research的研究科学家Murray Campbell说,虽然这是现代AI研究,但从历史上看,棋盘游戏一直是测试计算机功能的好方法,他在同一期《科学》上撰写了有关AlphaGo主题的论文。他说,让电脑玩棋盘游戏的想法可以追溯到1950年,而到了1990年代,这些机器在跳棋和国际象棋方面已经超越了人类。坎贝尔说:“在这些游戏上,我们花了数十年的时间才能达到比人类更好的表现。” “我认为他们在这个领域做得很好;他们使我们能够探索诸如AlphaZero中使用的技术。”
坎贝尔补充说,由于该领域的目标是“更复杂的任务”,因此使用AlphaZero中使用的技术的经验会有所帮助。“这是解决游戏的第一要点–并不是为了他们自己,而是(因为)这是一种可以取得进步的受限环境。”
至于人类玩家,即使李某退休后,他仍然计划在十二月份“最后的挑战”,根据对韩国时代:他会反对另一个AI,叫Handol,这是在韩国开发进站。
领取专属 10元无门槛券
私享最新 技术干货