本周二我们在知乎平台发起了“AI新知挑战”活动,精选了知乎平台四大AI经典问题与大家交流。以下是IBM对于其中一个问题:“如何向人类同伴证明自己不是一个人工智能?”的回答,在这里与大家分享。
证明自己不是一个机器人这件事儿,我们每天都在干。登录网站时需要输入数字验证码,在“我不是机器人”的条款上打勾,还有最近经常使用的“滑动验证”,这些都是人类被怀疑是机器的时刻。
向同伴证明自己不是机器人,并不是这两年的“新玩法”,早在68年前,人们就想让还很笨拙的计算机骗过人类,并为此发明了复杂的方法……
图灵的新想法:让计算机来冒充人!
1950年,图灵提出了最早的人机测试。在图灵测试中,测试者(人类)可以通过打字、说话等形式向被测试者(机器)进行提问,既包括人脑无法瞬时计算的复杂数学难题,也包括比如像“今天的天气怎样”这样的日常对话。当进行多次测试后,如果有超过30%的测试者在听到回答后不能确定被测试者是人还是机器,那么这台机器就被认为具备了人工智能。
长久以来,图灵测试都被认为是检验人工智能的终极测试,直到在英国皇家学会举行的“2014图灵测试”大会上,“聊天男孩”尤金·古斯特曼被33%评委认定为人类,作为第一位“人工智能”通过了图灵测试。但仔细观察尤金与人类的对话,我们不难发现其中的破绽——在被问及常识性问题时,尤金都是通过“避而不答“这一手段来误导人类的判断:
计算机科学家 SCOTT AARONSON:鞋盒子与珠穆朗玛峰,那个更大?
>> EUGENE:现在我还不确定,我得再想想。对了,我忘记问你来自哪儿了?
SCOTT AARONSON:一只千足虫有多少条腿?
>> EUGENE:只有 2 条。但考虑到切尔诺贝利事故,它有可能增加到 5 条。我知道你在对我说脑筋急转弯。
SCOTT AARONSON:没有,我需要知道你不是一个聊天机器人。请直接回答这个问题:一只蚂蚁有几只腿?
>> EUGENE:2 至 4 条吧,也许,3 条?哦,这是一次多么富有成果的对话。
这项”富有成果“的对话充分揭示了图灵测试的漏洞,只要掌握了”回避“这一手段,越来越多的机器都能轻而易举地“欺骗”人类,但这并不意味着人工智能实质性的进步,这样的“欺骗”也无法帮助人类实现更多价值。那么什么样的测试才能辨别出真正智能的机器呢?
听得懂人话,会思考
“说人话”是电脑从机器向人工智能发展的第一步,但想要迈好这一步,不仅需要高级的人工智能技术,还要让“听懂并组织语言”这种能力为人类的生产生活创造价值。
2011年,IBM Watson在美国最受欢迎的智力竞猜电视节目《危险边缘》(Jeopardy!)中击败了该节目历史上两位最成功的选手Ken Jennings和Brad Rutter,成为第一位在电视节目中获得冠军的人工智能,一举让人们记住了这个“聪明”的机器。
Watson在《危险边缘》中获胜
通过不断的机器学习,Watson将机器的自然语义处理带入新境界,它可以充分理解人类语言中微妙和复杂的含义、讽刺口吻、双关语及谜语等,打破了“人类擅长”的边界。用Jennings在赛后采访的话来说,Watson的夺冠意味着计算机在自然语言处理方面的一次巨大飞跃——计算机已有能力理解和回应日常对话。
然而,故事远远没有结束。“说人话”仅仅是人工智能发展的第一步。IBM将AI的核心能力定义为以自然语言为基础的URLI,即理解,推理,学习和交互。这就意味着,IBM在研发AI时从输入到输出全方位赋予AI更高级的本领,让AI在“观点表达”方面也能有出色的表现。
URLI解释示意图
巧识逻辑破绽,犀利幽默辩驳
在智力游戏节目中,AI要学习的是冰冷冷的百科知识,而要与人类辩论,则要在短时间理解人类的政治、文化、法律甚至是情感和艺术等非理性内容,同时根据对方辩手的陈述,组织论据,陈述富有逻辑的观点,并带点适当的幽默来感染现场观众。
由IBM Research研发的AI系统Project Debater分别在2016、2018年与以色列国家辩论冠军Noa Ovadia和以色列国际辩论协会主席Dan Zafrir进行辩论,还连续拿了辩论冠军。
Project Debater拿到辩题后,它会迅速扫描其庞大的语料库文档中与主题相关的数百万篇新闻和论文等材料,找出与辩题相关性最高的观点,通过算法剔除多余且重复的信息,提取出一个最具说服力的观点。同时,在人类辩手4分钟的观点陈述时,边听边“想”,不仅准确地回应人类对手的论点,还指出了对手所犯的事实错误,同时不失时机地展现了一个机器人的幽默。
这意味着机器不再只是对非黑即白的问题做出正确回答,而面对没有标准答案的问题,也能对观点或论据进行决策,并权衡其相关性比重。如果通过机器学习让Project Debater拥有更广的“知识面”,那么它将在商业应用场景中,帮助人类丰富决策过程,权衡新想法和新理念的利弊。
Project Debater与人类辩论
人工智能的“独立思考”能力不仅仅可以用于知识竞赛或辩论,IBM力求让机器思维赋能更多行业专业领域
金融顾问:AI系统可以帮助金融顾问从海量数据中找出金融事实,用以支持或反对金融分析师所思考的金融投资选择。
律师:律师可以借助AI系统来寻找相关案件和主张,或模拟法庭辩论来分析优势和劣势。
公共事务决策:通过AI系统公正的优/缺点分析和对人类困境的模拟,可以就需要进行决策的问题,为决策者提供基于事实、没有人为偏见的观点。
学生助手:AI系统可以帮助各个年龄段的学生改进他们的批判性思维和沟通技巧,或帮助他们找出更多信息以改进报告和论文。
CEO 和高管:高层领导常常因拥有强烈的“直觉本能”而感到自豪,但是他们也必须避免所谓的“锚定偏见”。锚定偏见是指,我们在潜意识中有着两三个会不太客观地影响决策的事实时,就会将不适合这些观点的有价值信息排除在外不予考虑。像Project Debater一样的AI系统可以拓宽高层领导的思路,在关键决策中纳入他们可能没有考虑到的新观点。
看完这些,是不是感觉后背微微发凉,有没有在怀疑这篇稿子也是人工智能完成的呢?AI时代下,人与机器不该是相互怀疑、对立的存在,而是需要协同发展、不可分割的整体。是不是机器并不重要,能不能无碍交流、相辅相成,共同完成各项任务,才是我们应该讨论的人机测试的关键。
关于AI的精彩讨论还在继续,欢迎参与
我们在知乎@IBM中国官方平台发起的
【AI新知挑战】
精选四大经典AI相关问题等你来战
如何向人类同伴证明自己不是一个人工智能?
如果你突然失明了该怎么办?
未来三十年内,哪些行业的工作人员可能会被人工智能取代?
如果人类自身的智慧水平最后被AI超过,算是进化么?
...
长按识别下图二维码即可参与讨论
同时欢迎大家在留言区分享你的精彩观点
领取专属 10元无门槛券
私享最新 技术干货