是什么使我们人类如此擅长于理解视觉数据?几十年来,这个问题一直困扰着人工智能和计算机视觉科学家。迄今为止,在重现人类视觉能力方面的努力取得了值得赞扬的结果,但仍然有很多不足之处。
我们当前的人工智能算法可以以极高的准确性检测图像中的对象,但前提是它们已经看到了许多(数千个甚至数百万个)示例,并且前提是新图像与以前所看到的图像差别不大。
为了解决深度学习的浅薄和脆弱性,人们进行了一系列努力,这是当今计算机视觉中使用的主要AI算法。但是有时候,找到正确的解决方案是基于提出正确的问题并以正确的方式提出问题。目前,围绕修复计算机视觉算法实际需要执行的操作存在很多困惑。
在上个月发表的一篇论文中,麻省理工学院和加利福尼亚大学洛杉矶分校的科学家认为,制造能够推理人类等视觉数据的AI系统的关键是解决计算机视觉的“暗物质”。像素看不见的东西。
这篇论文的标题为“ 黑暗,超越深层:向具有人类常识的人工智能的范式转变 ”,探讨了当前计算机视觉方法所缺少的五个关键要素。作者认为,添加这五个组件将使我们能够从“用于小任务的大数据” AI过渡到“用于大任务的小数据”。
当今的AI:大数据处理小任务
麻省理工学院和加州大学洛杉矶分校的AI研究人员写道:“深度学习的最新进展基本上是基于“小任务的大数据”范式,在这种范式下,大量数据被用来训练单个狭窄任务的分类器。
人工智能的最新进展依赖于深度神经网络,即机器学习算法,可大致模拟人脑和动物大脑的模式匹配能力。深度神经网络就像是堆叠在一起的复杂数学函数层。为了执行其功能,DNN经历了一个“训练”过程,在此过程中,它们会被提供许多示例(例如图像)及其相应的结果(例如图像包含的对象)。DNN调整其功能的权重以表示跨通用类的对象找到的通用模式。
领取专属 10元无门槛券
私享最新 技术干货