现如今,人工智能已经在下围棋方面胜出,可在驾驶汽车时,却似乎比人类显得笨拙。今年美国的一辆无人驾驶汽车在城市道路上做实验时,将一位横穿马路的行人撞倒。这起事故,也让这一备受热捧的新技术受到一些争议。无人驾驶下一步该从哪些技术角度进行完善,我国的无人驾驶技术近来有哪些进展?日前,在由中国自动化学会主办、西安交通大学承办的2018中国自动化大会上,中国工程院院士郑南宁对此进行了解读。
中国工程院院士、西安交通大学教授/人工智能与机器人研究所所长、中国自动化学会理事长 郑南宁
下围棋属于逻辑推理脑力劳动,而驾驶汽车却是感知、运动等结合的脑力劳动。人类经过驾校训练,相对容易就可以掌握这个技能,但是用机器实现它却遇到了艰难挑战。人工智能追求的长期目标是使机器能像人类一样感知世界和解决问题。对当前人工智能而言,解决某些对人类来说属于智力挑战的问题相对简单,但解决那些与真实物理世界发生交互的问题依然很困难,而无人驾驶恰恰属于这类问题。
人类擅长感知预测 计算机擅长逻辑推理
这种情况在人工智能领域被称为莫拉维克悖论。“它意味着人类觉得简单的事情,计算机却难做到,人类觉得难度大的事情,计算机却完成得很轻松。”郑南宁说,早在20世纪80年代,人工智能研究者就发现了这个挑战,对计算机而言实现逻辑推理等人类高级智慧只需要相对很少的计算能力,而实现感知、运动等智慧行为却需要巨大的计算能力。
这种情况是由二者的基本特性决定的。如果把人脑和计算机做一个比较,计算机显然是在逻辑性、可重复性和规范性方面超过了人类,但是人类的大脑具有动态性、复杂性,还具有创造性和想象力。“人类思维是在记忆经验和知识的基础上进行预测、模式分类以及学习的。特别要注意这个预测能力,每个人的大脑中都有预测的模型,所以说从本质上来讲,大脑就是一个预测的机器,而对于驾驶行为而言,预测能力非常重要。”郑南宁说:“但计算机要实现这种预测则非常困难。”
传统人工智能的局限性
郑院士提到,人类面临的许多问题具有不确定性、脆弱性和开放性。当下,人工智能的理论框架,是建立在演绎逻辑和语义描述的基础方法之上,但我们不可能对人类社会的所有问题建模,因为这中间存在着条件问题,我们不可能把一个行为的所有条件都模拟出来,这是传统人工智能的局限性。
① 符号化人工智能的局限性:对于一个可解的问题,通常的解决方法是抽象出一个精确的数学意义上的解析式数学模型(抽象不出,即归纳为不可解问题)。然后对已建立的数学模型设计出确定的算法,但确定的算法往往在面对复杂的现实世界中,具有测不准和不完备等缺陷。图灵意义下可计算问题都是可递归的(“可递归的”都是有序的),而实际中存在大量的开放性、动态性和脆弱性问题。
② 深度神经网络的局限性:CNN算法在实际应用中,往往会过度依靠训练数据,缺乏推理和对因果关系的表达能力,而大量的人工智能问题需要给出处理对象间的关联、因果以及控制关系。深度神经网络依靠于指令驱动或数据驱动,其存储架构无法进行高效的图数据索引和存储,而在一些应用中需要基于事件驱动的计算。深度神经网络也无法在计算过程中实现有效的注意机制(计算负载与资源分配),而选择性注意机制是构成高级AI的基本核心。
让机器像人一样对物理世界直观理解
人脑对于非认知因素的理解更多地来自于直觉,并受到经验和长期知识积累的影响,这些因素在人对物理环境理解与行为交互、非完整信息处理等问题中有着极其重要的作用。而且人类的学习是一种与事物互动的过程,人类认知过程中的特征概念形成往往是建立在语义解释的基础上;人类依赖对事物的观察(或显著性特征的注意)在大脑中建立不同的内部分析模型,并利用这些模型来推测事物的变化,或是从过去的事件预测未来。
而机器学习中的特征提取及预测模型与人类认知过程中的特征概念形成及其内部分析模型是完全不同的,为使机器学习模型产生人类的认知结果,需要其所学特征在一定程度上符合神经生理学实验结果,同时要使特征具有数学和语义的解释性。此外,大脑神经网络结构的可塑性,以及人脑在非认知因素和认知功能之间的相互作用,它们是形式化方法难以、甚至不能描述的。因此,郑南宁院士提出:“我们需要从脑认知机理和神经科学获得灵感和启发,发展新的AI计算模型与架构,让机器具备对物理世界最基本的感知与反应,即使机器具有“常识”推理的能力,从而实现更加健壮的人工智能系统。”
需要建造一种更加健壮的人工智能,需要脑认知和神经科学的启发。计算机和人类大脑是对问题求解的物质基础。在智力和计算能力方面,计算机远远超过了人类,但是人类面对的大部分问题都是开放的、动态的、复杂的,大脑在处理这种问题时表现出的想象和创造,还有对复杂问题的分析和描述,是传统人工智能的方法所不能企及的,我们只能够从人类大脑的神经网络结构中去获得构造新的人工智能的因素。
直觉推理、认知推理和因果模型是构建健壮的人工智能必须考虑的基本因素。那么如何来构造一个具体的系统?郑南宁院士认为,构造机器人需要三个基本要素:1.对环境中的所有对象进行特征识别,并且进行长期记忆;2.理出对象间的关系,并对它们相互间的作用进行描述;3.基于想象力的行为模型,人在进行具体行动之前,会想象其带来的后果,但机器就需要分析物体之间的各种关系。
这三种要素是让机器像人一样理解物理世界的基础。具有想象力的人工智能,就需要首先构造一个内部预测的模型,在行动之前预想到的结果,其次给出环境模型,提取有用信息,然后规划想象行为,最大化任务效率(具有想象力的AI)。
用认知解决无人驾驶
现在绝大多数自动驾驶采取了场景感知与定位,决策规划与控制,这是一种简单的 ADAS 形式,但我们要如何通过新的方法来解决这个问题?郑南宁院士认为,第一,要让自动驾驶汽车像人一样理解和记忆,就要具有记忆推理和经验分析的技术;第二就,要构建进化发展的自动驾驶,其学习过程要像人类一样熟能生巧。
人对变化是非常敏感的,可以提取交通场景中的显著性变化。比如你在开车时,如果右前方突然来了一个骑自行车的人,你的注意力会转移到骑车人的身上。在自动驾驶汽车上,郑院士认为要构造一个选择性的注意机制网络,对数种图像进行理解,并根据内部状态的表示,忽略不相关的对象,选择下一步要采取的动作。把场景感知和情境计算融合在一起。构建一个模型,融合先进知识概念,实现记忆学习。数据驱动转变为事件驱动,得出可行驶数据和不可行驶数据大的划分。
无人驾驶没那么快进入生活
从对错误的容忍度来说,人工智能系统可以分成两大类:一类犯了错误可以重来,另一类在统计意义上不能够犯错误,无人驾驶属于后者。
从这一现实来看,郑南宁认为当前的无人驾驶技术主要面临对环境的可靠感知、预行为理解、应对意外等方面的难题。
“对环境的可靠感知,也就是说无论在任何路况和天气状况下,无人驾驶汽车都能准确而周密地感知周围环境。”郑南宁说,而预行为理解即对对方可能产生的行为进行准确的预估和判断,另外还有就是对意外遭遇的处理,包括如何对交警的手势作出反应,如何应对突然从路边闯进一个小孩等意外情况。“这样的突发异常情况是无人驾驶必须要解决的,但目前还无法事先为这类场景编码,也无法用简单的基于规则的模型来应对。”
郑南宁表示,针对这些难题所开展的尝试,需要把深度学习网络、长短期记忆、选择性注意机制以及提取知觉物体等技术,整合在基于认知计算引擎的自主驾驶系统中,这是无人驾驶研究领域值得研究的方向。
他总结出了实现复杂路况中无人驾驶的四个核心技术:
1.如何在环境感知数据获取与融合过程给出知觉物体的基本判断,形成选择注意的基本单元;
2.如何在注意的基础上,将非完整的环境信息转化为用于决策规划的空间结构信息;知觉编组能用最少的领域只是形成目标假设;
3.如何在学习和知识集成的基础上,实时处理行驶过程中的突发事件,即具有自学习功能
4.如何在环境交互和行为决策的基础上,构建无人驾驶的控制系统
在11月份由国家自然科学基金委员会组织的2018中国智能车未来挑战赛上,西安交通大学研制的“先锋号”智能汽车进入高架道路后,平稳汇入多辆有人驾驶车辆的自然车流。这辆无人驾驶实验车还在没有GPS信号的情况下,在高架桥下的地面道路,由计算机自主驾驶通过了S形的弯道和各种路障。
尽管取得了这些进展,但郑南宁认为对无人驾驶仍然应该保持冷静,并没有那么快就进入生活。“真实的交通环境复杂多变,实现完全自主的无人驾驶是一个令人兴奋却又望而生畏的艰难挑战。”
发现人工智能的突破点还需更多时间
那么,最终有没有可能找到一种终极算法,能使某种智能不仅能完成单一的任务,还能具有非常强大的普遍适应性能力,来解决无人驾驶等任务呢?
郑南宁表示,未来需要从脑认知和神经科学研究中得到启发,发展一种新的学习机器。
“将神经科学和脑认知作为新的机器学习算法和架构的灵感来源,使用这些知识来帮助我们思考在人工智能系统中如何实现同样的功能,是未来人工智能发展重要的研究方向之一。”郑南宁说,“我们需要更多时间来发现受脑认知和神经学科启发的人工智能突破点在哪里,也需要多学科的实验科学家和理论科学家的合作。”
他同时提醒,面对近年来人工智能的热潮,更应该将基础研究建立在严谨的理论、模型建造、实验验证与分析的基础上。
“如果让社会的期望值过高,又没有达到预期的目标,它就有可能给学科发展带来低潮,甚至是灾难性影响,使最初期望的目标成为‘皇帝的新衣’。”郑南宁说:“面对人工智能的研究与其在无人驾驶等领域的应用热潮,我们需要保持冷静的思考,踏踏实实推进基础研究和实验验证。”
本文部分内容摘自光明日报
领取专属 10元无门槛券
私享最新 技术干货