11月18日,第五届世界声博会暨2022科大讯飞全球1024开发者节在合肥拉开序幕。开幕式上,中国科学院院士鄂维南发表了《下一代人工智能》的主题演讲,分享对未来的思考与展望。
▲ 2022科大讯飞全球1024开发者节
鄂维南院士表示,关于下一代人工智能可能是人工智能领域里面讨论的最多的一个话题。以深度学习为核心的这一代人工智能已经取得了巨大的成功,但仍然存在多方面的挑战。因此,发展下一代人工智能,是人工智能领域许多人都在思考和探索的问题。
巨大成功背后 这一代人工智能面临的挑战
从图像识别、AlphaGo下围棋,到蛋白质结构解析,以深度学习为核心的“这一代“人工智能,已经取得了巨大成功。那么为什么还需要发展“下一代”方法呢?鄂维南院士用一个简单且深刻问题,引发大家的思考。
要回答这个问题,就必须从人工智能的底层逻辑出发。人工智能的底层逻辑包括社会逻辑、科学逻辑和商业逻辑。
在社会层面,我们要努力确保新的技术是有利于社会发展的。在科学层面,人工智能在工程方面已取得巨大成功,但是在科学方面仍然有很多问题,尤其是深度学习,像是一堆黑魔术。人工智能不应该仅仅是一些技术的组成,而是一个系统的Science,就像物理化学这类传统学科一样。
商业逻辑方面有三个关键问题——能不能用,是不是可靠,以及成本如何。对于能不能用,还存在许多挑战。以皮肤状况鉴别诊断为例,虽然深度学习提供了高诊断精度,但不具备可解释性,这严重制约了实际应用。对于可靠性问题,鄂维南院士举猴子照片的例子说到,虽然深度学习算法能够准确识别猴子,但是如果猴子前面存在遮挡,深度学习算法有可能将其识别为人类。在成本维度,深度学习有效但并不高效,需要大量训练数据、人力成本和算力消耗。
▲ 中国科学院院士鄂维南发表演讲
数据、算法、系统……,下一代AI需要解决的基本问题
当谈及下一代人工智能时,“数据、算法、平台、模型、系统以及应用”是重要的六大维度。在大会现场,鄂维南院士着重分享了对“数据、算法和系统”三个方向的思考。
首先,谈到系统层面,如果平台上有几百个,几万个,甚至几十万个模型,就需要一个模型管理系统。这里涉及不仅仅是技术问题,还包括社会学,以及社会制度的问题。对于数据,可以说, 目前深度学习模型都是建立在原始数据的基础上。现在人工智能这么高的门槛,很重要原因就是需要处理大量的非结构化数据,例如视频、文本等。这些的处理成本比较高。对此,鄂维南院士分享了邰骋、汤林鹏等开发的AI数据库的想法,即在原始数据湖或数据系统,加一层AI数据库,其效果就像把非结构化数据库结构化一样,可以用通常搜索语言实现搜索, 并且实现了高精度、高效率地实现精确或近似查询。这为模型开发提供了新的、更加高效的模式。
关于算法,鄂维南院士则分享到,目前人工智能算法基本分为两大类,一类是基于学习(数据、经验)的算法,例如深度学习、强化学习等,也就是这一代人工智能。另一类就是基于规则的算法,比如逻辑方法、符号方法、专家系统,即上一代人工智能。其中,专家系统的可解释性相对好,但是对复杂系统的准确度不够。与此同时,深度或强化深度学习则对复杂系统的准确率比较高,但可解释性比较差。
▲ 中国科学院院士鄂维南发表演讲
如何能找到一个可解释性强,并且对复杂系统准确率高的新方法?鄂维南院士分享了自己的建议——墨奇算法。墨奇算法有四个关键点:首先是非结构化数据的多尺度表示;其次是知识驱动的自监督学习;再者是基于算法的规则提取;最后是迭代改进。同时,以指纹识别为例,分享了墨奇算法如何发挥作用,并建立起第一个十亿级指纹识别系统。这样的系统仅仅依靠深度学习是做不到的。
“深度学习为什么能取得这么大的成功?”鄂维南院士最后分享道,在2012年,写深度学习的程序是非常困难的。现在,基本上本科生都能很容易做到。巨大转变的背后是一个非常完善的生态,包括算法、算力、好的数据集、以及模型训练平台等。因此,下一代人工智能不是个单纯的算法,而是要建立起来一个良好的生态。
面向未来,鄂维南院士也在大会现场呼吁,企业、高校与科研机构携手,建立这样的良好生态,共同实现下一代人工智能。