Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >哈萨比斯首次解读AlphaZero竟被当场diss,他起身当面回击说…

哈萨比斯首次解读AlphaZero竟被当场diss,他起身当面回击说…

作者头像
量子位
发布于 2018-03-23 02:18:53
发布于 2018-03-23 02:18:53
5840
举报
文章被收录于专栏:量子位量子位
夏乙 假装发自 长滩 量子位 出品 | 公众号 QbitAI

有争论才有意思。昨天是机器学习“炼金术”,今天则是AlphaZero。

在NIPS大会期间,DeepMind创始人兼CEO哈萨比斯(Demis Hassabis)出席了自己赞助的一个研讨会。在这个活动上,哈萨比斯首次公开解读了他们最新的研究成果AlphaZero

哈萨比斯在演讲中首先提到DeepMind背后的哲学,这家公司奉行的第一性原理。回顾了AlphaGo在此前比赛中的表现,特别是那些具有“独创性”的时刻。

至于最新的AlphaZero,哈萨比斯坦言结果出乎他们预料。DeepMind本来认为手动调整的国际象棋引擎Stockfish已经接近最优解,但没想到AlphaZero还是在24小时之内,通过不断地自我对弈,最终击败了Stockfish。

当然不只是击败了一个国际象棋程序,AlphaZero还横扫了日本将棋程序Shogi,以及刚刚创下佳绩的围棋程序AlphaGo Zero。

在国际象棋比赛中,AlphaZero的棋风,既不像人、也不像电脑。

哈萨比斯介绍说,AlphaZero偏爱远期的局面性弃子,没有子力的概念。AlphaZero会根据当前的局面进行判断,相较而言,如果使用了刚性规则就无法动态调整策略。人类可以向AlphaZero学习国际象棋的战略,而不是战术。

当然,哈萨比斯也没忘了问一句:人类关于国际象棋的知识是不是太有限了?(╭(╯^╰)╮)

说句题外话,关于这次的AlphaZero,固然又给DeepMind挣了脸,但是奇怪之处在于,有关AlphaZero的研究,论文只在arxiv上“草草”发出了事。

既没有发Nature,也没有投会议。甚至DeepMind官方博客、推特等渠道,也没有专门发文提及此事。

这不像DeepMind既有技术,又擅长“炒作”的风格呀……

马库斯当场Diss哈萨比斯

安妮薇,对于DeepMind最新搞出的AlphaZero,有人溢于言表的赞美。当然也有人一万个不爽。

比方,纽约大学的马库斯老师(Gary Marcus)。他是纽约大学心理学和神经科学教授,所涉猎的领域包括人类和动物行为、神经科学、人工智能。马库斯还曾担任Uber AI实验室的负责人(主要他的AI创业公司被Uber收购了)。

哈萨比斯讲完后不久,马库斯登台。他很快指出:DeepMind令人惊叹的结果,仍然依赖于一些人类知识,比方使用了蒙特卡洛树搜索。

接着,他提出一个“理论”:认知(Cognition)可以视为三个变量的函数,写成公式就是:Cognition = f (a,k,e)。其中a代表先天算法,k代表先天知识,e代表经验。

“DeepMind已经非常令人信服的表明,即便k值接近于0(zero),也能获得出色的认知表现”,马库斯表示。

不过你有没有发现,马库斯实际上用公式写了一个大大的单词:f a k e。

马库斯对于DeepMind以及AlphaGo的主要抨击点在于,哈萨比斯等人的工作,低估了对人类知识和特定领域的需求。

马库斯主张人类拥有先天的知识,而神经网络基本不具备。他认为在特定领域的专长,不等于先天性。他举了几个例子,例如膝跳反射、人脸识别、国际象棋都是特定领域的能力,但先天性方面各自不同。

而通用智能不分领域,有部分是天生的。

马库斯指出,如何认知对象等等能力,可能都是进化所赋予人类的天生能力(当然也有观点说这些都不是天生的)。

“生命不是一场Kaggle竞赛。”

马库斯表示,生命是一场训练集(training set),没有什么是预先准备好的整齐数据,很多情况都无法预测。在这个过程中,每天的挑战都不一样,真正应该重视的是那些可以用在多个领域的知识。

哈萨比斯当面回击

其实马库斯有点看什么都不满意的习惯,之前马库斯还跟LeCun等人公开叫板。只不过这一次,他diss的对象,就坐在台下。

于是最劲爆的一幕出现了。

哈萨比斯听完马库斯的一番言论,然后当场起身开始了回击。哈萨比斯表示,DeepMind并不是反对先天知识,他们方法已经远超完美信息博弈的范畴,而且整合了神经科学、认知心理学的原理。

哈萨比斯的回击,这有段视频,可以感受一下:

OMT

关于AlphaGo、AlphaZero的争论,让量子位想起不久前看到的一篇论文。论文的题目是AlphaGo祛魅:Demystifying AlphaGo Zero as AlphaGo GAN

这篇论文的作者是南京东南大学的几位学者:

  • 董晓,副教授,影像科学与技术系
  • 伍家松,讲师,影像科学与技术系
  • 周玲,副教授,计算机工程系

他们在这篇论文中指出:

AlphaGo Zero的惊人成功,在全球范围内引发了对人类社会未来的讨论,期间夹杂着希望、焦虑、兴奋和恐惧混合的情绪。 我们尝试对AlphaGo Zero去魅,通过定性分析表明AlphaGo Zero可以被理解为特定结构的GAN(生成对抗网络),这个系统本应具有良好的收敛性。 因此,我们认为AlphaGo Zero的成功,可能不是新一代AI的标志。 可能影响AlphaGo Zero性能的因素包括:1、围棋的固有属性;2、AlphaGo Zero的结构(基于ResNet的价值和策略网络,MCTS和强化学习)。 这篇论文中,我们通过指出AlphaGo Zero可以被理解为一个具有良好收敛预期的特殊GAN,来试图定性的回答这个问题。

如果你对这篇论文感兴趣,可以在量子位微信公众号后台回复:“祛魅”两个字,就能获得相关的下载地址。

文中的现场图文、视频来自推特账号:@thinkmariya、@willknight等。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-12-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
视频全程:哈萨比斯首次公开解读AlphaZero
允中 发自 凹非寺 量子位 出品 | 公众号 QbitAI 上个月,NIPS 2017召开期间,DeepMind创始人兼CEO哈萨比斯,在一个研讨会上发表了演讲。当时也是哈萨比斯首次公开解读Alpha
量子位
2018/04/02
6420
视频全程:哈萨比斯首次公开解读AlphaZero
马库斯再谈AlphaGo Zero不是从零开始,AGI可能需要这十大先天机制
安妮 编译整理 纽约大学心理学和神经科学教授马库斯(Gary Marcus)坚信AlphaZero仍依赖于一些人类知识,也曾在AlphaZero解读现场这样diss哈萨比斯。 可能觉得说得不够,近日,马库斯在arXiv发布了本月第二篇长文Innateness, AlphaZero, and Artificial Intelligence,继续论证AlphaZero“可以在没有人类指导的情况下训练到超过人类水平”的说法被夸大了。 “当代人工智能论文(通常)用了一个‘相当不错的’具体结果,对更广泛的主题做出了
量子位
2018/01/30
6320
马库斯再谈AlphaGo Zero不是从零开始,AGI可能需要这十大先天机制
AlphaZero登上《科学》封面:一个算法“通杀”三大棋,完整论文首次发布
不仅会下围棋,还自学成才横扫国际象棋和日本将棋的DeepMind AlphaZero,登上了最新一期《科学》杂志封面。
量子位
2018/12/25
5930
AlphaZero最革命性的一点是,它没有棋子的概念
关注风云之声 提升思维层次 解读科学,洞察本质 戳穿忽悠,粉碎谣言 导读 AlphaZero下国际象棋的时候,最革命性的一点是,它没有棋子的概念。无论是人类高手还是过去的顶级AI,再怎么也是以棋子实力评估为基础的,被吃了大子会心疼,在这个基础上再去进行“重视中央”之类的局面评估理论。而AlphaZero却完全对棋子没有概念,只要它认为未来整体局势好,弃子根本不叫事。这次Deepmind新论文应该给出结论了,“MCTS+神经网络”就是先进生产力的代表。 2017年12月6号,Deepmind扔出了一篇论文
企鹅号小编
2018/02/11
1.4K0
AlphaZero最革命性的一点是,它没有棋子的概念
又一棋坛AI崛起:AlphaZero自学4小时击败最强国际象棋程序,8小时击败AlphaGo
谷歌旗下人工智能公司DeepMind将围棋AI转战国际象棋和日本将棋领域——无须人类智慧加持,已胜券在握。 AlphaZero是由谷歌旗下DeepMind研发的通用棋类AI,以不到四小时的自学击败了世界最强的国际象棋程序。 重新改进的人工智能程序AlphaZero曾多次击败世界顶级围棋选手,并扩大到学习其他棋类项目。它从零开始学习国际象棋,仅用4小时,就在100盘比赛中击败了世界顶级国际象棋程序 Stockfish 8。 据在康奈尔大学图书馆的arXiv上发表的一篇未经同行评审的研究论文称,在这100场
企鹅号小编
2018/03/05
1.4K0
又一棋坛AI崛起:AlphaZero自学4小时击败最强国际象棋程序,8小时击败AlphaGo
AlphaZero登上Science封面:从小白开始制霸多个游戏
此前不久,DeepMind 还推出了 AlphaFold,成功地根据基因序列预测出蛋白质的 3D 形状,将人工智能技术应用在了科学研究领域。
机器之心
2018/12/25
5730
AlphaZero登上Science封面:从小白开始制霸多个游戏
AlphaZero诞生一周年:登上Science封面,完整论文首次公开
阿尔法元(AlphaZero)诞生一周年之际,《科学(Science)》杂志今天以封面文发布了阿尔法元(AlphaZero)经过同行审议的完整论文,Deepmind创始人兼CEO哈萨比斯亲自执笔了这一论文。
大数据文摘
2018/12/25
7180
AlphaZero诞生一周年:登上Science封面,完整论文首次公开
观点 | 精通国际象棋的AI研究员:AlphaZero真的是一次突破吗?
选自 Medium 机器之心编译 参与:路雪、 刘晓坤 近日,Jose Camacho Collados 在 Medium 上发表了一篇题为《Is AlphaZero really a scienti
机器之心
2018/05/10
9910
天才也勤奋!DeepMind哈萨比斯自述:领导400名博士向前,每天工作至凌晨4点
哈萨比斯天天见。这位DeepMind创始人、AlphaGo之父,一直是全球赞颂的当世天才,但每天要到凌晨4点,才能睡下。
量子位
2019/04/24
5530
天才也勤奋!DeepMind哈萨比斯自述:领导400名博士向前,每天工作至凌晨4点
AlphaGo之父戴密斯·哈萨比斯:是天才,也是生活里的普通人
Deepmind创始人戴密斯·哈萨比斯是这个时代公认的天才,他不仅是世界AI领域的第一人,还是世界国际象棋大师、电脑游戏设计师、企业家和神经学家,世界范围内再无第二个人能把这些身份融为一体。
数据猿
2019/09/18
2.2K0
AlphaGo之父戴密斯·哈萨比斯:是天才,也是生活里的普通人
【重磅】AlphaZero炼成最强通用棋类AI,DeepMind强化学习算法8小时完爆人类棋类游戏
作者:闻菲,刘小芹,常佩琦 【新智元导读】或许“智能爆炸”不会发生,但永远不要低估人工智能的发展。推出最强围棋AI AlphaGo Zero不到50天,DeepMind又一次超越了他们自己,也刷新了世人对人工智能的认知。12月5日,包括David Silver、Demis Hassabis等人在内的DeepMind团队发表论文,提出通用棋类AI AlphaZero,从零开始训练,除了基本规则没有任何其他知识,4小时击败最强国际象棋AI、2小时击败最强将棋AI,8小时击败李世石版AlphaGo,连最强围棋AI
新智元
2018/03/20
1.6K0
【重磅】AlphaZero炼成最强通用棋类AI,DeepMind强化学习算法8小时完爆人类棋类游戏
“全能棋王”AlphaZero的启示 直觉如何战胜逻辑
来源:新浪科技  作者:DeepTech 现代文明和科技已经使得我们的直觉不断退化。绝大多数人都没有意识到直觉的价值甚至没有意识到它的存在。作为复杂计算的基础,直觉是一种很容易被忽视的非常规方法。这种非常规性使得许多研究人员忽视它的潜力。 本文引用地址:http://www.eepw.com.cn/article/201712/373152.htm 我在人工智能领域所做的工作围绕“先进的认知机器将使用直觉作为其智力基础”这一想法。我们人类的思想为一般化的智力提供了充足的证据。人类本质上是直觉机器,而我们
企鹅号小编
2018/02/24
6850
“全能棋王”AlphaZero的启示 直觉如何战胜逻辑
不只是围棋!AlphaGo Zero之后DeepMind推出泛化强化学习算法AlphaZero
选自arXiv 作者:David Silver等 机器之心编译 在 DeepMind 发表 Nature 论文介绍 AlphaGo Zero 之后,这家公司一直在寻求将这种强大算法泛化到其他任务中的可能性。昨天,AlphaGo 研究团队提出了 AlphaZero:一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法。据称,新的算法经过不到 24 小时的训练后,可以在国际象棋和日本将棋上击败目前业内顶尖的计算机程序(这些程序早已超越人类世界冠军水平),也可以轻松击败训练 3 天时间的 A
机器之心
2018/05/09
7550
不只是围棋!AlphaGo Zero之后DeepMind推出泛化强化学习算法AlphaZero
再进化!通用算法 AlphaZero 再攻克几种棋又有何难
本文介绍了 AlphaZero 是如何利用深度强化学习解决围棋问题的。首先,AlphaZero 在无任何人类指导的情况下,通过自我对弈的方式学会下围棋。然后,它利用蒙特卡洛树搜索和深度神经网络来评估局面和选择策略。最后,通过与人类世界冠军和之前的围棋 AI 进行比较,AlphaZero 证明了其强大的围棋下棋能力。
企鹅号小编
2017/12/27
9270
再进化!通用算法 AlphaZero 再攻克几种棋又有何难
【DeepMind最新论文】新AlphaZero出世称霸棋界 ,8小时搞定一切棋类!自对弈通用强化学习无师自通!
【导读】从AlphoGo Zero 到AlphaZero只是少了一个词“围棋”(Go), 但是背后却代表着Hassabis将和他的DeepMind继续朝着“创造解决世界上一切问题的通用人工智能”这一目标道路上迈出了巨大的一步。今天DeepMind在arXiv发表论文表示其开发的通用强化学习程序AlphaZero,使用蒙特卡洛树搜索(MCTS)和深度神经网络,和强大的算力,同时在国际象棋,日本将棋和围棋中战胜各自领域的最强代表。而且这一切都是通过自我对弈完成的,在训练中除了游戏规则,不提供任何额外的领域知识。
WZEARW
2018/04/11
9660
【DeepMind最新论文】新AlphaZero出世称霸棋界 ,8小时搞定一切棋类!自对弈通用强化学习无师自通!
AlphaZero如何学习国际象棋的?
DeepMind 和 Google Brain 研究人员以及前世界国际象棋冠军Vladimir Kramnik通过概念探索、行为分析和对其激活的检查,探索了人类知识是如何获得的,以及国际象棋概念如何在 AlphaZero 神经网络中表示。
deephub
2021/12/28
8150
AlphaZero如何学习国际象棋的?
动态 | AlphaZero 荣登《科学》杂志封面
AI 科技评论按:一年前,Alphabet 旗下人工智能部门 DeepMind 发布 AlphaZero,称它可以自学国际象棋、日本将棋和中国围棋,并且项项都能击败世界冠军。而今天,经过同行评议,AlphaZero 一举登上《科学》杂志封面。
AI科技评论
2018/12/25
5750
动态 | AlphaZero 荣登《科学》杂志封面
AlphaZero完胜三大世界冠军棋类程序:5000个TPU、自学一天
Root 编译整理 量子位 出品 | 公众号 QbitAI 昨天,DeepMind团队又在arXiv上扔了个重磅炸弹,新一代AlphaZero在用了强劲的计算资源(5000个一代TPU和64个二代TPU)之后,用不到24小时的时间自我对弈(tabula rasa,也叫白板)强化学习,接连击败了三个世界冠军级的程序 (国际象棋、将棋、围棋)。 △ AlphaZero和国际象棋冠军程序对弈 其中包括上一代冠军围棋程序AlphaGo Zero,这个程序发布还不到两个月,DeepMind就又把自己颠覆了(所以谷歌团
量子位
2018/03/22
1.2K0
AlphaZero完胜三大世界冠军棋类程序:5000个TPU、自学一天
NIPS大会最精彩一日:AlphaZero遭受质疑;史上第一场正式辩论与LeCun激情抗辩;元学习&强化学习亮点复盘
机器之心原创 机器之心海外部 参与:Tony Peng、Alex Chen、Qintong Wu、之乎 美国时间周四,NIPS 大会走完了日程的一半。工业界的众多公司搬东西撤出了展览会场,受邀演讲也全
机器之心
2018/05/11
8140
比AlphaGo Zero更强的AlphaZero来了!8小时解决一切棋类! PENG Bo
Photo by Jason Kempin/Getty Images for Agon Limited 作者 | 禀临科技联合创始人 PENG Bo 读过AlphaGo Zero论文的同学,可能都惊讶于它的方法的简单。另一方面,深度神经网络,是否能适用于国际象棋这样的与围棋存在诸多差异的棋类? MCTS(蒙特卡洛树搜索)能比得上alpha-beta搜索吗?许多研究者都曾对此表示怀疑。 但今天AlphaZero来了(https://arxiv.org/pdf/1712.01815.pdf),它破除了一切怀
AI科技大本营
2018/04/27
7410
比AlphaGo Zero更强的AlphaZero来了!8小时解决一切棋类! PENG Bo
推荐阅读
视频全程:哈萨比斯首次公开解读AlphaZero
6420
马库斯再谈AlphaGo Zero不是从零开始,AGI可能需要这十大先天机制
6320
AlphaZero登上《科学》封面:一个算法“通杀”三大棋,完整论文首次发布
5930
AlphaZero最革命性的一点是,它没有棋子的概念
1.4K0
又一棋坛AI崛起:AlphaZero自学4小时击败最强国际象棋程序,8小时击败AlphaGo
1.4K0
AlphaZero登上Science封面:从小白开始制霸多个游戏
5730
AlphaZero诞生一周年:登上Science封面,完整论文首次公开
7180
观点 | 精通国际象棋的AI研究员:AlphaZero真的是一次突破吗?
9910
天才也勤奋!DeepMind哈萨比斯自述:领导400名博士向前,每天工作至凌晨4点
5530
AlphaGo之父戴密斯·哈萨比斯:是天才,也是生活里的普通人
2.2K0
【重磅】AlphaZero炼成最强通用棋类AI,DeepMind强化学习算法8小时完爆人类棋类游戏
1.6K0
“全能棋王”AlphaZero的启示 直觉如何战胜逻辑
6850
不只是围棋!AlphaGo Zero之后DeepMind推出泛化强化学习算法AlphaZero
7550
再进化!通用算法 AlphaZero 再攻克几种棋又有何难
9270
【DeepMind最新论文】新AlphaZero出世称霸棋界 ,8小时搞定一切棋类!自对弈通用强化学习无师自通!
9660
AlphaZero如何学习国际象棋的?
8150
动态 | AlphaZero 荣登《科学》杂志封面
5750
AlphaZero完胜三大世界冠军棋类程序:5000个TPU、自学一天
1.2K0
NIPS大会最精彩一日:AlphaZero遭受质疑;史上第一场正式辩论与LeCun激情抗辩;元学习&强化学习亮点复盘
8140
比AlphaGo Zero更强的AlphaZero来了!8小时解决一切棋类! PENG Bo
7410
相关推荐
视频全程:哈萨比斯首次公开解读AlphaZero
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档