人工智能的终极目标仍然是建造具有人类智能水平、并以我们能够理解的方式思考的机器。
——阿尼尔·阿南萨斯瓦米
人工智能——内置巧合的机器——终于渐趋成熟,并在核爆炸疏忽的监察到早产儿脆弱身体的照料等众多领域得到广泛应用。它是如何做到这一切的?
在需要诊断疾病时,若有血肉之躯的医生和人工智能(artificial intelligence,AI)系统两个选择,佩德罗·多明戈斯会选择将自己的性命托付给后者。“我相信机器胜过相信医生。”身为西雅图华盛顿大学的计算机学家多明戈斯如此宣称。
回到20世纪60年代,AI系统被寄予复制人类思维之关键的重大期望。科学家们开始使用数理逻辑来构建真实世界的知识,以及其背后的联系与逻辑。但人们很快便陷入僵局——逻辑固然可以按照人类思维的方式得出结果,但它天生就不适合处理不确定性。
AI复兴的核心之一是概率规划技术,它将旧式AI基于逻辑的特性与统计学和概率论的优势结合在一起。“二者都是发展用以理解万物之规律的最强有力的理论,二者的结合是非常自然的。”加州大学伯克利分校的现代人工智能先驱斯图尔特·拉塞尔如是说。这一结合终于开始驱散长久笼罩在AI领域的冬日迷雾。“AI的春天已经到来。”麻省理工学院的认知学家约什·特南鲍姆说。
“人工智能”的出现
“人工智能”一词由麻省理工学院的约翰·麦卡锡于1956年首先创造。当时,他大力提倡逻辑思考,以发展能够进行推理的计算机系统。这导致了一阶谓词逻辑的成熟应用,用标准的数学语言及符号刻画真实世界。一阶谓词逻辑用于描述一类物体及物体之间的联系,可以对事实进行推理并得出有用的结论。
例如,若X患上传染性很强的疾病Y,并且X与Z有过亲密接触,那么根据逻辑,我们很容易判断出Z也患上了疾病Y。
然而,一阶谓词逻辑的最大成功之处在于,它让人们找到了一种方法,使用许多最简单的逻辑刻画愈发复杂的实际情况。逻辑可以用最基础的概念形成极其复杂的结论,这不禁让人猜测人类的思维可能也是如此。
约翰·麦卡锡(John McCarthy)
可惜好消息到此为止。“坏消息是,事实并非如人所愿。”加利福尼亚斯坦福大学的认知学家诺厄·古德曼说。这是因为,使用逻辑表述并推理知识要求我们对真实世界具有足够确切的了解,容不得半点模糊和暧昧。
一件事情,要么是真的,要么是假的,不可能或真或假。不幸的是,真实世界中的几乎每一条概括性定理都充满了不确定性、起伏干扰和例外。所有基于一阶谓词逻辑的AI系统均无法处理这一问题。
它还存在另外一个严重的问题:无法反演。例如,如果已知Z患有疾病Y,我们不可能由此推测出Z一定是被X传染的。这是医疗诊断环节的典型问题:逻辑推理可以从疾病推断出症状,然而医生需要做的却是根据看到的症状反推出患者具有的疾病。“这需要将逻辑链路倒过来看,而推理逻辑不适合这么做。”特南鲍姆说。
这些问题导致在20世纪80年代中期,AI进入了寒冬期。在世人看来,AI已死,毫无出路。然而古德曼相信,人们实际上并没有放弃,“研究在暗中悄悄进行”。
神经网络,学会学习
春日的曙光首先出现于20世纪80年代末,那时神经网络刚刚面世。神经网络的原理异常简单,神经科学的发展让人们得以建立神经元的简单模型。借助精巧复杂的算法,研究人员们构建了人工神经网络(artificial neural networks,ANN),它可以进行学习,看起来与真正的大脑如出一辙。
神经网络促成了新型人工智能的一部分基础。某些研究人工神经网络的学者最终意识到,这些网络可以看作是真实世界的一种统计学和概率学描述。他们不再提起突触和脉冲,而是讨论参数化和随机变量。“现在,它听起来不再像是一个大脑,而是一个巨大的概率模型。”特南鲍姆说。
神经网络示意图
随后,在1988年,洛杉矶加利福尼亚大学的朱迪亚·佩尔的巨著《智能系统中基于概率的推理》问世,书中详细描述了实现人工智能的一种崭新方法。该方法基于18世纪英国数学家、牧师托马斯·贝叶斯(Thomas Bayes)提出的方法,后者把在Q事件发生的条件下P事件发生的概率与在P事件发生的条件下Q事件发生的概率联系在了一起,从而可以在因与果之间自如切换。
“如果你能用所有你感兴趣的事情描述现有的知识,那么贝叶斯原理可以告诉你该如何解读它们的效果,并回溯每一个不同的起因导致的概率。”特南鲍姆说。
零散的碎片拼在一起,形成学习真实世界的人工智能。贝叶斯网络的参数代表概率的分布,它对世界的认识越多,这些分布也就越接近事实。与基于一阶谓词逻辑的系统不同,即使面对不完整的知识,这个网络也不会崩溃。
AI前沿:逻辑与神经网络的结合
然而,逻辑并非毫无用处。人们发现,仅靠贝叶斯网络是不够的,因为它无法形成任意复杂的结构。只有将逻辑判断与贝叶斯网络结合在一起,概率规划才能发挥其真正的威力。
站在新一代AI的最前沿的,是融合了以上两者的众多计算机程序语言。Church是古德曼、特南鲍姆与同事们开发的语言……马尔可夫逻辑网络是由多明戈斯的小组开发的另一种语言,将马尔可夫网络(与贝叶斯网络类似)与逻辑结合在了一起。除此之外,还有拉塞尔与他的同事开发的一种语言,名字更为直截了当,就叫贝叶斯逻辑(Bayesian Logic,BLOG)。
朱迪亚·佩尔《智能系统中基于概率的推理》
在位于奥地利维也纳的联合国全面禁止核试验条约组织内部,拉塞尔证明了这类语言的强大能力。该组织大胆猜测AI技术或许有助于解决探测核爆炸问题,于是邀请了拉塞尔。在花了一个上午,听取了有关夹杂在地震背景信号、穿越地幔时信号的不规则失真,以及世界各地地震台站接收到的众多噪声信号的干扰中探测来自远方核爆炸的地震信号所面临的困难与挑战的报告后,拉塞尔立刻开始着手编写基于概率规划原理的数学模型。“趁着午饭工夫,我就把问题的完整模型写出来了。”拉塞尔说。模型很短,只有半页纸长。
已有的知识,例如在苏门答腊、印度尼西亚和英国伯明翰发生地震的概率,可以与该模型结合。CTBTO组织同样要求该模型假定地球上任何一处发生核爆炸试验的概率均相等。实际数据已准备妥当—CTBTO组织的监测台站源源不断地接收着震动信号。AI系统的任务就是分析收到的所有数据,并推测信号所代表的震动最有可能来自何方。
比医生更准确的诊断
问题来了:BLOG等语言使用的是一种通用推理引擎(generic inference engine)。对于任何一个给定的真实问题的模型,通过计算其中的变量和概率分布,该引擎都应该能给出相应的解答。例如,若已知预测事件的发生概率,根据得到的地震信号,引擎应可以给出核爆炸发生在中东的概率;若把变量换而表示症状和疾病,引擎则应给出合理的医学诊断结果。换句话说,程序的算法应具有良好的通用性——这意味着程序的运行效率将大大降低。
结果是,每当遇到一个新的问题时,我们必须调整算法,使之最大限度适应该问题。但你不可能每遇到一个新问题都雇一名博士生来改进算法。拉塞尔说:“你的大脑并不是这样解决问题的;大脑会适应每一个新的问题。”
然而,这并没有浇灭AI 领域燃起的热情。例如,斯坦福大学的达夫妮·科勒正使用概率规划方法集中攻克一个特定的问题,并取得了显著的成效。科勒与同在斯坦福大学的新生儿专科医师安娜·佩恩以及其他同事研发了一个名为PhysiScore的系统,用于预测早产儿是否会面临健康问题,这在新生儿科学中是十分困难的任务。医生几乎无法较为准确地给出任何预判,“而这恰恰是父母最为关心的问题。”佩恩说。
PhysiScore 综合考虑妊娠期、出生体重等指标及婴 儿出生后数小时内的实时监测数据(包括心率、呼吸率和 血氧饱和度)。“我们可以在婴儿出生后三小时内判断其是否健康,是否更容易具有严重的并发症。即使那些症状要到出生后两周才会变得显著,我们仍然可以预先给出结论。”科勒说。
“像一个真正的人一样”
除了发展灵活快速的推理算法,研究者还必须要改进AI系统的学习能力,让其能够不仅从已有数据,而且通过传感器获得的有关真实世界的数据学习。如今,绝大多数的机器学习是通过针对问题优化算法并巧妙构建数据集而完成的,相当于让机器做某种专门的工作。“我们希望系统能更多样化,这样我们就可以把它直接放到真实世界里,让它利用更多种类的输入信息进行学习。”科勒说。
人工智能的终极目标仍然是建造具有人类智能水平、并以我们能够理解的方式思考的机器。“这个目标可能与寻找外星生命一样极为遥远,甚至具有危险,”特南鲍姆说。“类人AI这一表述覆盖的范围更广,同时也更易于调整。我们乐于看到,有一天我们造出了一个视觉识别系统,它朝窗外看一眼,就能告诉我们外面有什么—就像一个真正的人一样。”
【以上节选自《我,算法》】
领取专属 10元无门槛券
私享最新 技术干货