这已经不是新闻了——IBM的人工智能辩论系统Debater在前不久输给一位人类辩手。这其实是Debater的第二次亮相。第一次是去年6月跟两位以色列高手(因为IBM这个项目实验室在以色列),但那次的人类据说比较水,两位之中相对牛逼的Noa Ovadia也只是以色列冠军而已,而这一次的Harish Natarajan好歹是2012年欧锦赛的冠军。
Debater的原理,我的猜测,大致是这样的。给定辩题之后,有四个步骤:一是依据相关性原则,从海量数据库中选出相关信息;二是通过语义分析,判断这些信息是支持自己的,还是反对自己的;三是挑出支持的信息,去重,并按照逻辑进行分类分层;四是按演讲稿的要求,进行润色,怎么开场,怎么引用数据,怎么抖包袱。第四步其实也比较难,所以IBM几年前开始储备的,不仅是媒体及社交数据本身,还有人们对这些信息的反应,这样才能在最终效果上打动人类。
那如此强大,为什么还失败了呢。个人觉得有两个原因,第一个,也是很多媒体谈到的,就是在反驳环节犯了逻辑错误。这次辩论分三个环节:4分钟的立论,4分钟的反驳和2分钟的结论。立论和结论环节,基本都是陈述性的,按前面讲的原理,AI应该是比较强的,所以没有露怯。但到了反驳环节,由于语义理解,或者处理时间的问题,AI似乎并没有理解人类的观点,所以也就没法进行针对性的反驳,于是相形见绌。
第二个原因,是赛制和运气的问题,辩论的胜负取决于现场观众的取向变化。所以AI先前的79张赞同的高票,反而成为一种负担,因为你“劝降”对象只有少数21人,而对手可以在你的79人里尽情挖角;第二,是人情味还有人类自尊心的问题,同样一句话,AI说和人类说,让人产生的共鸣程度是不同的。如果AI能做到自然语音,然后在图灵测试这样纯语音环境下进行比赛,胜负的结果可能更有说服力。
IBM从最早的Deep Blue,到现在的Debater,在决策支持上可谓矢志不渝。这一次的操作,还是挺值的,不仅显示了在AI领域叫板Google的实力,也为自身决策支持系统积累了强大的案例和品牌。最终达到的效果,肯定不是辩论赛了,我觉得一方面,是在中间性的问题上给出直接的决策建议;另一方面,也是在决策的过程中提供更多的参考信息。所以,Debater虽然输了这次辩论,但观众在投票“哪位辩手更能为你提供有用信息”这个问题上,还是投给了Debater。估计看到这个结果,IBM的PR心里都松了口气。
领取专属 10元无门槛券
私享最新 技术干货