以你现在的速度你只能逗留原地。如果你要抵达另一个地方,你必须以双倍于现在的速度奔跑! --卡罗尔
从哪儿说起呢?就从“人工智能”这个名字开始讲起吧。人工智能,英文是Artificial Intelligence,这个翻译非常准确(有些翻译并不准确,本书就能看到几个)。当然,翻译准确,原文不一定好,也许英文的命名就不贴切。先说一下“人工”,英文是Artificial,什么叫人工呢,如图1.1。
图1.1,大金链子水上漂,这个金链子就是人工的(Artificial)。“人工”一词在中英文中都有一个共同的意思:人造的,假的,赝品的。无论是中文还是英文中,这个词都略有贬义的成分。当然,在“人工智能”这一词语中,人工并不是贬义。人工智能其实就是人造的智能,意思是用计算机模拟人的智能。
说完“人工”,再说“智能”。什么是智能?不知道。注意,智能不同于聪明,如果你说一个人聪明,那么我们当然可以说这个人有智能,但是如果你说一个人不聪明,很笨,却不能说这个人没有智能。智能好像是人类专有的一种能力。“什么是智能”这个问题,如果你问100个心理学家,也许会有101个答案。不要去问哲学家这个问题,首先,哲学家不会直接给你答案,其次,哲学家会让你选修他的课程,然后从柏拉图讲到哥德尔。
美国发展学家Howard Gardner在1983年出版的《智力的结构》中提出了一种多元智能理论,被认为比较好地描述了人类的智能,这些多元智能包括:. 语言智能:听说读写能力。表现为能够流利清晰地描述事件、表达想法,与人交流,能够阅读和写作等。. 音乐和节奏智能:感受、辨别、记忆、改变和表达音乐的能力,具体表现为个人对音乐美感反应出的包含节奏、音准、音色和旋律在内的感知度,以及通过作曲、演奏和歌唱等表达音乐的能力。. 逻辑数学智能:运算和推理的能力,表现为对事物间各种关系(如类比、对比、因果和逻辑等关系)的敏感,以及通过数理运算和逻辑推理等进行思维的能力。. 空间智能:感受、辨别、记忆、改变物体的空间关系并借此表达思想和情感的能力。表现为对线条、形状、结构、色彩和空间关系的敏感,以及通过平面图形和立体造型将它们表现出来的能力。. 运动智能:运用四肢和躯干的能力。表现为能够较好地控制自己的身体,对事件能够做出恰当的身体反应,以及善于利用身体语言表达自己的思想和情感的能力。. 自知和内省的智能:认识洞察和反省自身的能力,表现为能够正确地意识和评价自身的情感、动机、欲望、个性、意志,并在正确的自我意识和自我评价的基础上形成自尊、自律和自制的能力。7. 人际关系智能:与人相处和交往的能力,表现为觉察、体验他人情绪、情感和意图,并据此做出适宜反应的能力。8. 自然观察智能:辨别环境(包括自然环境,也包括人造环境)、适应环境的能力。 2016年,Gardner还拓展了多元智能的描述,认为人类还有一种智能,叫做“教学和传递知识”的智能。人类一般都具有这些智能,比如,人们可能五音不全,即使不会唱歌不会作曲,但是大家都会听歌,都有喜欢的戏剧或歌曲,那么他也有音乐智能。对于机器来说,在某几个方面也许达到了一定程度的智能,但是目前并没有任何一个机器具备了上述全部智能。 |
---|
2016年,Gardner还拓展了多元智能的描述,认为人类还有一种智能,叫做“教学和传递知识”的智能。 人类一般都具有这些智能,比如,人们可能五音不全,即使不会唱歌不会作曲,但是大家都会听歌,都有喜欢的戏剧或歌曲,那么他也有音乐智能。 对于机器来说,在某几个方面也许达到了一定程度的智能,但是目前并没有任何一个机器具备了上述全部智能。
了解了“人工”和“智能”概念之后,是不是就能够定义“人工智能”是什么?并不是。人工智能的初衷是希望利用机器替代人类工作。但是这种替代很早就出现了啊,见图1.2,挖掘机技术哪里强?要说替代人工作,挖掘机好像是功不可没,不过好像没人把挖掘机看成是人工智能。有人说,应该是替代人进行脑力工作,那也有啊,计算器,计算器的计算能力远超人类,计算是标准的脑力替代,但是人们也不认为计算器具有智能。那么满足什么条件的替代才叫人工智能呢?
神级人物之图灵:
图灵(Alan Mathison Turing,1912-1954),英国数学家,逻辑学家,密码学家。本书中的第一位神级人物,被称为“计算机之父”。见图1.3。
图1.3 新版50元英镑上的图灵
1937年,图灵发表论文《论数学计算在决断难题中的应用》,在论文里描述了一种可以辅助数学研究的机器,后来被称为“图灵机”(现代计算机的基础),这个图灵机模型为现代计算机的逻辑工作方式奠定了基础,图灵也因此被称为“计算机之父”。
1939年9月,图灵受命破译德国Enigma加密机,这台机器成功运行,对盟国的二战胜利帮助巨大。
图灵对于人工智能的发展有诸多贡献,提出了一种用于判定机器是否具有智能的试验方法,即图灵测试。
因为图灵后期的研究主要用于军事上(破解密码)。而图灵生前虽然提出了图灵机的概念,但是,计算机还没有流行,不为大众所知。因此,图灵在生前得到的关注不多。
图灵还擅长长跑,1948年,图灵曾打算代表英国参加在伦敦举行的奥运会马拉松项目。在那次比赛上,当时冠军的成绩是2小时34分51.6秒(Delfo Cabrera 阿根廷),而图灵曾跑出了2小时46分03秒的好成绩。据英国《泰晤士报》报道,图灵的最好成绩在当年(1947年)足以排名世界前三。
图灵生前并不为大众所知,可能因为他年纪轻轻就去世,也可能因为他做的工作很多是保密的(破译敌军的密码)。他去世后的若干年,慢慢得到了迟来的赞誉。在2021年版50元英镑纸币上,出现图灵的头像,计算机领域最高奖—图灵奖—以他命名,因为计算机领域没有诺贝尔奖,因此图灵奖的地位相当于诺贝尔奖。
图灵贡献如此巨大,网络也有很多传言,例如传说苹果公司的logo,也就那个被咬了一口的苹果(),是为了纪念图灵,因为图灵吃了毒苹果而死亡(《乔布斯传》曾对此辟谣,这个logo之所以在苹果上画了一个缺口,是为了不让人们误解—这不是一个樱桃)。
1956,图灵被发现死于家中的床上,床头还放着一个被咬了一口的泡过氰化物的苹果。警方调查后认为是氰化物中毒,调查结论为自杀。
当时,图灵年仅41岁。
图灵给出了人工智能的一个测试标准——图灵测试。图灵在1950年发表的论文[1]中提出了图灵测试的概念。图1.4(a)是图灵测试的示意图。图灵测试表述如下:如果把一台机器放到一个屋子内,并且与人类展开对话,而不能被人类辨别出其机器身份,那么称这台机器具有智能。当然这种对话不一定是说话方式,而是一种机器方式,比如键盘输入和屏幕输出。图灵测试无法量化,而是人来做裁判,因为不同的人的判断标准也不一样,图灵在1952年还解释过,如果70%的人都判断不出来屋子里面是人还是机器,那么就可以认为这台机器具有智能。注意,这个标准是和人类是否更像,而不是是否比人类更强。
举一个例子,图灵测试中,如果问对方996×699等于多少,如果对方比较快的给出答案,很可能判断对方是机器而不是人,因为这个口算比较难。但是如果问对方996×996等于多少,对方较快回答992016,对方是人还是机器?这就很难说,为什么?因为这个数有速算技巧,996=1000-4,9962=10002-2×1000×4+42,口算即可得到答案,所以有一些人能够快速给出答案。虽然996×699也有速算技巧(996×699=996×(700-1)),但是还是比较难算。这里可以看出,图灵测试的标准是很主观的。
中国作家刘慈欣的科幻小说《三体》讲了一个外星人(三体人)攻打地球的故事,三体人科技比人类发达很多,对地球人拥有碾压式的优势,但是很长时间内,三体人并没有打败地球人,为什么?因为三体人不会欺骗。所以按照图灵测试的标准,三体人应该通过不了图灵测试,不符合人类的智能。
从这个角度来说,ChatGPT反倒是通过了图灵测试。因为ChatGPT在回答问题上也偶尔会出错,当它一本正经地胡说八道的时候,你会发现ChatGPT和人类很像。
虽然人类智能的特点是会说谎,但是在创建人工智能的时候,还是不要创建会说谎的机器人。
和“图灵测试”对比,美国哲学家赛尔于20世纪80年代初提出过一个“中文屋”思想实验。想象一位只会英语的人身处一个房间之中,这间房间除了有一个小窗口以外,全部都是封闭的。他随身带着一本写有中文翻译程序的书。房间里还有足够的稿纸、铅笔和橱柜。写着中文的纸片通过小窗口被送入房间中。根据赛尔的说法,房间中的人可以使用他的书来翻译这些文字并用中文回复,虽然他完全不会中文。赛尔认为通过这个过程,房间里的人可以让房间外的人以为他懂中文。赛尔创造“中文屋”思想实验来反驳电脑和其他人工智能能够真正思考的观点。房间里的人不会说中文,他不能够用中文思考,但因为他拥有某些特定的工具,他甚至可以让以中文为母语的人以为他会中文。事实上,电脑就是这样。它们无法真正的理解接收到的信息,但它们可以运行一个程序,处理信息,然后给人以智能的印象。赛尔认为本质上这样的机器是没有智能的。“图灵测试”和“中文屋”其实是相似的思想实验,但是表达了截然相反的观点。
事实上,人工智能领域也吸引了很多哲学家进行研究。不止是计算机专业的人,很多哲学家、数学家、社会学家等多个领域的人都在研究人工智能。人工智能技术的影响力也渗透到了材料学、医学、生物学等各个领域。
构造人工智能这一想法如此深邃,通过学习人工智能,也会加强对人类智能本身的理解。
“华盛顿砍了樱桃树”、“牛顿被苹果砸到”、“爱因斯坦和小板凳”,这些故事为什么能广泛流传?事实上,这些故事很可能都是人造的(artificial),但是,为什么人类还是愿意相信并且传播它们?人类到底智能吗?
人工智能之所以如此难描述,因为其实对于人类智能本身,也并没有太好的研究结果。《人类简史》[6]一书中的提到一个观点:人类受叙事方式影响极大,人类爱听故事。人类之所以能够发展到今天,精神世界的虚拟概念起了巨大的作用。国家、宗教、公司这些概念,对人类的发展起到了巨大的作用,正因为这些虚拟的概念,才使得人类从众多动物中脱颖而出。比如IBM公司(少有的存活超过百年的大公司),到底是什么?如果说IBM公司指的是公司的产品,该公司今天的产品和过去的产品早就不一样了;如果说是IBM公司是指它的员工,可公司的员工早就换了多少批了;如果IBM公司是指它的办公室或工厂厂房,这个公司已经搬过好几次家,地点也和最初不一样了。古代哲学家普鲁塔克提出一个哲学概念,“忒休斯之船”(忒休斯是一位传说中的雅典国王),一艘可以在海上航行几百年的船,归功于不间断地维修和替换部件,只要一块木板腐烂了,它就会被替换掉,以此类推,直到所有的功能部件都不是最开始的那些了。问题是,最终产生的这艘船是原来的忒休斯之船,还是一艘完全不同的船?如果不是原来的船,那么在什么时候它不再是原来的船了?哲学家霍布斯后来对此概念进行了延伸,如果用忒休斯之船上取下来的老部件重新建造一艘新的船,那么这两艘船中,哪艘才是真正的忒休斯之船?
为什么人类相信虚拟概念,目前还不知道原因,也许这就是人类智能的特点。动物应该不会理解这样的虚拟概念,一头奶牛不会祈祷人们去相信佛教,虽然这对于奶牛有很大的好处(佛教不杀生)。人工智能也不理解虚拟概念,机器知道的,只是执行指令。
也许世界本身就是虚拟的,人类的各种思想不过是脑电波的各种信号,那么,又凭什么认为我们生活的世界是真实的?
美国科学家普特南于1981年提出了“缸中之脑”思想实验[7]:
“一个人(想象一下那是您自己)在睡觉的时候,神不知鬼不觉地被一个邪恶科学家施行了手术,他的大脑(您的大脑)被从身体中取出,放入一个缸中,缸里盛有维持脑存活需要的营养液。脑的神经末梢和一台超级计算机相连,这台计算机使大脑的主人保持一切完好的幻觉。对于他来说,似乎人、物体、天空还都存在,但实际上,此人(您)体验到的一切都是计算机传输到神经末梢的电子脉冲的结果。这台计算机非常聪明,此人要是抬起手,计算机发出的反馈能让他“看到”并“感到”手正在抬起。不仅如此,邪恶科学家还可通过改变程序使受害者“体验到”(即幻觉到)邪恶科学家所希望的任何情景或环境。他还可以消除这次脑手术的痕迹,从而使受害者觉得自己一直是处于这种环境。受害者甚至还会以为他正在读书,对,就是现在在读这本《人工智能:是什么、为什么、怎么做》,读的就是这样一个有趣但荒诞的故事:一个邪恶科学家把人脑从人体中取出放到一个有营养液的缸中,神经末梢连到一台超级计算机。”。
图1.5是“缸中之脑”思想实验的一个示意图,你觉得你在驾船出海,可是你怎么知道这不过是大脑受到电信号的刺激?
这个思想实验是如此迷人,衍生出一系列讨论,是好多科幻电影的灵感来源。如电影《黑客帝国》,就是“缸中之脑”思想的电影化。“缸中之脑”的特点是不能被证伪。大家可以想一下,如何证明你现在生活在真实世界中,而不是受“缸中之脑”控制的?
中国的庄子也有类似的思想实验,庄周梦蝶,到底是人做梦变成了蝴蝶,还是蝴蝶梦见自己变成了人?
既然人类爱听故事,那么就索性多讲几个故事。人工智能发展中的故事还真挺多。我们从一次会议讲起。
一次会议,是指1956年在达特茅斯学院召开的一个持续两个月的夏季讨论班,现在一般称这次讨论班为达特茅斯会议。这次会议开启了人工智能学科,也就是在这次会议上,出现了Artificial Intelligence这个术语(虽然有人考证,该术语之前就出现过,但是在这次会议之后,这个术语才得到大众承认),这次会议被公认为人工智能研究的开始,1956年,也就成为了人工智能的元年。
对于这次会议,现在给予多高的评价都不为过,但是在当时,参会的人员并不知道自己创造了历史,“当时只道是寻常”,人们以为这只是一次普通的暑期研讨班,也就是几个研究人员在暑假的时候,一起头脑风暴,会议持续了大概两个月(有人中途参加有人中途退出,目前也不知道到底有多少人参加,一般认为主要人物有十多个)。在当时,参会人员的主力还是年轻小将,比如会议的召集者麦卡锡和明斯基当年都是29岁,在当时还没有那么大的影响力。当然,这次会议也有大佬,比如香农、司马贺等人。会议上,大家的学术争议也很多,当时也并没有达成了一致意见。另外,由于并没有形成什么完整的会议纪要,所有的资料都来自部分参会人员后来的回忆(主要来自所罗门诺夫)。若干年后,人们才意识到这次会议创造了历史。2006年,在达特茅斯会议50周年之际,部分当时参会人物还特意重聚。(见图1.6,图1.6(a)为开会时部分参会人员拍照留念,图1.6(b)为50周年纪念会议拍照留念。)
1956年九月,IRE(也就是现在的IEEE)在麻省理工学院召开了信息论年会,麦卡锡对一个多月前的达特茅斯会议作了一个总结。在当事人的回忆中,很多人都觉得九月份开的IRE信息论年会干货更多,但是也许这些干货是暑期那次头脑风暴的结果。后来的人工智能技术,很多都能在这次达特茅斯会议上找到源头。
出道即巅峰。在达特茅斯会议上,纽厄尔和司马贺公布了一款程序“逻辑理论家”(Logic Theorist),这个程序可以证明怀特海和罗素的《数学原理》一书中命题逻辑部分的一个很大子集。这次会议之后,在问题求解,包括机器博弈、定理证明等取得了一系列让人震惊的成果。受这些成果鼓舞,人们相信人工智能很快就能解决诸多问题。例如,在达特茅斯会议之后不久,司马贺预言,10年内电脑能打败最优秀的棋手,虽然最后这个预言迟到了30年。
人工智能之后的发展并不是一帆风顺。1973年,英国爵士莱特希尔对人工智能的研究状况做了详尽调查,调查报告中提到“人工智能研究没有带来任何重要影响”,人工智能来到了第一次寒冬;在上世纪7、80年代,人工智能领域的专家系统、模式识别、自然语言理解等各种不同的领域,开拓出广阔的应用前景,到上个世纪80年代达到顶峰,日本提出了全世界瞩目的第五代计算机计划(人工智能计算机,后来失败)[8]。其后各种人工智能技术因为迟迟没有达到人类的预期,又冷落到无人问津,人工智能来到了第二次寒冬,以至于在这个时候,谁一提到“人工智能”,就觉得此人是个骗子,搞人工智能的专家学者纷纷转行。
科学的发展总是起起落落,柳暗花明又一村,今天人工智能又迎来了春天,资本涌入,从业者年薪百万的新闻层出不穷,岂止是春天,简直是人工智能的盛夏。
这些起起落落的发展中,以两场棋局最具代表性。
为什么要讲下棋的故事?因为在人们心中,下棋是人类智能的代表。如果机器在下棋领域把人类打败了,那机器一定有智能,因此,一直有人尝试制造下棋机器人。
图1.7是土耳其下棋机器人。土耳其机器人在18世纪制造,能下棋,并且打败了很多人类高手,深受人们欢迎,每到一个地方都引起了轰动。不过后来人们发现,所谓机器人,其实是有个下棋高手藏在某个地方,至于这个下棋高手藏在哪,人们就不知道了。所以,这其实不是人工智能,这是魔术。不过这个故事也证明人们对于制造下棋机器人的渴望。
事实上,好多计算机先驱,包括巴贝奇、图灵、冯·诺依曼、香农等人,都研究过下棋机器。巴贝奇是18世纪的科学家,制造过机械式计算机。受于当时的技术条件,他只能使用机械装置设计了一台能够进行四则运算、比较大小和开平方等运算,以及能够进行简单控制的计算机。(帕斯卡更早的时候制作了一台机械式计算器,不过只能手动做加减法,算是计算器,不算计算机;莱布尼茨改进了帕斯卡的计算器,不过依然没有控制功能)。
“后世的人们说,李卫公之巧,天下无双,这当然是有所指的。从年轻时开始,他就发明了各种器具。比方说,他发明过开平方的机器,那东西是一个木头盒子,上面立了好几排木杆,密密麻麻,这一点像个烤羊肉串的机器。一侧上又有一根木头摇把,这一点又像个老式的留声机。你把右起第二根木杆按下去,就表示要开2的平方。转一下摇把,翘起一根木杆,表示2的平方根是1。摇两下,立起四根木杆,表示2的平方根是1.4。再摇一下,又立起一根木杆,表示2的平方根是1.41。千万不能摇第四下,否则那机器就会哗喇一下碎成碎片。这是因为这机器是糟朽的木片做的,假如是硬木做的,起码要到求出六位有效数字后才会垮。他曾经扛着这台机器到处跑,寻求资助,但是有钱的人说,我要知道平方根干什么?一些木匠,泥水匠倒有兴趣,因为不知道平方根盖房子的时候有困难,但是他们没有钱。直到老了之后,卫公才有机会把这发明做好了,把木杆换成了铁连枷,把摇把做到一丈长,由五六条大汉摇动,并且把机器做到小房子那么大,这回再怎么摇也不会垮掉,因为它结实无比。这个发明做好之后,立刻就被太宗皇帝买去了。这是因为在开平方的过程中,铁连枷挥得十分有力,不但打麦子绰绰有余,人挨一下子也受不了。而且摇出的全是无理数,谁也不知怎么躲。太宗皇帝管这机器叫卫公神机车,装备了部队,打死了好多人,有一些死在根号2下,有些死在根号3下。不管被根号几打死,都是脑浆迸裂。”
--王小波《红佛夜奔》
在人机对弈领域,真正有标志影响的是两场棋局。第一场发生在1997年,1997年5月11日,IBM的计算机程序“深蓝”(Deep Blue)在正常时限的比赛中击败了卡斯帕罗夫(当时排名世界第一的国际象棋棋手),标志着人工智能进入了一个新的时代(见图1.8(a))。在计算机看来,下棋就是一种局面的搜索。在当前棋局下,如果下了某一步棋子,会有很多种后继可能的走法出现,每一种都会形成一个新的局面,计算机下棋就是在这些以后可能出现的所有局面中找出最可能赢的那一个。1997年的深蓝可搜寻并估计随后的12步棋,而一名人类象棋好手大约可估计随后的10步棋。在比赛之后,卡斯帕罗夫回忆,第二局是关键,机器的表现超出他的想象力,它经常放弃短期利益,表现出非常人类化的危险。换句话说,在下棋方面,这台机器通过图灵测试了。
这次人机大战轰动一时,报纸电视上长篇累牍报道这件事情。虽然在国际象棋领域,机器战胜了人类,但是,在棋类领域还有一个顶峰,围棋,等待机器去战胜。在世纪之交的时候,人们普遍的看法是,要再过50年,也就是2050年左右,机器才能在围棋战胜人类顶尖高手。对于这个预言,提前30多年实现了。
2016年,Deepmind公司的AlphaGo在围棋领域战胜了人类顶尖高手李世石,是人工智能领域另一场重要的棋局(见图1.8(b))。因为距离现在时间更近,而且互联网更加发达,所以这场棋局的影响更大,传播更远。围棋一直被认为是棋类领域最后的堡垒。事实上,在深蓝战胜卡斯帕罗夫之前,人们已经意识到在国际象棋领域,计算机一定会取得胜利,所以那次胜利有“水到渠成”的意思。但是在AlphaGo和李世石对弈之前,包括围棋领域和计算机领域专业人士,都认为AlphaGo不能战胜人类。围棋的局面实在太多了,围棋有19×19=361个落子点,每个点有黑子、白子、无子三种可能,共有3361种可能,这个数目如此巨大,计算机无法搜索出较好的局面。但是最终的结果表明,机器战胜了人类,并且从此之后,可以宣布,在棋类领域,机器完全胜过人类。
这两场棋局的标志性意义不在于技术上有多强,更大的意义是使得整个社会都意识到人工智能超强的能力,这是人工智能领域最好的宣传。也是在这件事情之后,人工智能才开始获得广泛的关注。
这两场棋局更能吸引大众的眼光。但是从专业的角度来看,另一场不太被公众关注的棋局更有代表性意义。
2017年末,Deepmind又发布了AlphaGo的升级版本,AlphaGo Zero(简称AlphaZero)。AlphaZero不仅在围棋上战胜了AlphaGo(100:0取胜),而且击败了国际象棋软件Stockfish8。在国际象棋领域,大家此前都认为Stockfish8已趋于完美,它的代码中有无数人类精心构造的算法技巧,有几百年来人类国际象棋经验的总结,还有每秒7000万次的计算能力。相较之下,AlphaZero每秒只能计算8万次,而且写程序的时候完全没有教它任何国际象棋规则,它连基本的起手下法都不会。AlphaZero完全是运用最新的人工智能技术,不断和自己下棋,就这样自学了国际象棋。虽然如此,在AlphaZero和Stockfish8的100场比赛中,AlphaZero赢了28场,平了72场,一场未败。那么,AlphaZero从零开始学习国际象棋,用了多久才发展出天才般的棋力?答案是三天。千百年来,国际象棋一直被认为是人类智慧一个绝佳展示平台。但是只花了三天,完全没有任何人类的指导,AlphaZero就从一无所知变成了打遍天下无敌手的国际象棋大师。
机器战胜人类固然抓人眼球,但是背后的技术,才是学习人工智能最应该关注的,为了实现人工智能,不同的研究人员发展出了不同的技术学派。
本文内容节选自《人工智能:是什么?为什么?怎么做?》,由张恩德编著
待续......
版权声明
版权属于原作者,仅用于学术分享