首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

总002期:人肉智能-Part 1

前言

何谓“智能”,人类的肉体是怎么诞生智能的,本文试图解释人类的智能是怎么构成的,其原理、组成结构和工作流程。依据于这一套理论,可以看出人类智能可能达到的目标或可能的走向,也可能有助于在设计人工智能时考虑的更全面或规避一些问题。

本文纯属个人推测,没有经过任何正儿八经的学术研究和考据,如有错误或疏漏,概不负责,但如果碰巧蒙对了,本人保留所有权利。

需要注意的是,本文描述的是人类的人肉智能,并不是人类的人肉意识(或称自我意识)。如果在您费心审阅的过程中觉得“人肉智能不是这样的”或“人肉智能不仅仅如此”的时候,您可能需要翻看本文的姐妹篇:人类的意识(还没写)。

人肉智能的组成

我认为,人类的智能由4个功能块组成:识别->抽象->逻辑关系形成->逻辑关系推演。虽然说是4个功能块,但是并不是解剖学上的“模块”,不如把他们看成4个函数,互相调用,互相嵌套,组成一幅无限的分叉和循环图。

首先说识别

以前专家们每次谈人工智能的时候,总要强调一下,人工智能无法识别照片里的一只猫。虽然现在的专家不敢这么说了,因为算法AI已经多次超过了人类的识别率了,但我们还是要来分析一下为啥人类的识别能力这么强?其实答案很简单,人类作弊了。

人类的识别能力是建立在多重输入下的经验识别。看到这个定义可能觉得很复杂,大家都是用眼睛看,什么叫多重输入,怎么个经验了?我这么定义,是因为有多重因素帮助了人类的识别。

首先,人类有2只眼睛,生物学的研究很早就告诉我们由于2个眼睛的输入,大脑是同时接受到2幅画面的,而且由于眼睛之间的距离导致的视差,大脑最终把这两幅画面进行融合,得到了一个立体的图像,我称之为立体图像投射。这个立体感知带来的最直接的功能就是距离估计。虽然由于照片是平面化的,在识别照片中的猫的时候距离感帮不上太多忙,但是距离感以及之前所获得的经验可以帮助人类快速识别出“躲在树丛里的猫”“横着走的猫”“纵向走的猫”等等,用学术一点的话来说,由于距离感带来的经验使得人类对于照片是有景深的概念的。通过这一点,人类在识别大赛上就偷偷作弊了一小点。

第二,聚焦。搞摄影的人都知道,最好的照相机是人眼,人眼拥有全自动对焦的能力使得人可以把视线集中到他想看清楚的物体上,同时忽略周围的物体。但是具体把视线聚焦到哪里需要用到第三个能力。

第三,识别能力有一个最重要的基础是边界的判定。边界判定是识别的前提条件,我想这个理由应该无需解释了。然而在这一点上人类天生多了两个助手,就是“手”。触觉在人类的识别练习过程中,起到了强有力的辅助作用,在识别练习的早期甚至是决定性的。通过一边看一边摸,人类的大脑迅速建立起“形状”“光线及阴影”“棱角”等概念。这些经验的习得,特别是光线阴影与形状棱角之间的关系,使得人类建立了可以将通过眼睛看到的图像中的各种色差还原成边界的能力(一种潜意识的推理能力),进而轻松将其与周围物体区别开来。现在登录网页为了防止机器人登录往往会设置图片识别码要求输入,这里面主要用的就是边界混淆。图片识别码往往是在待识别字符上面叠加斑块状叠印,甚至是同色块叠印,对机器来说是很大的挑战,但是对人类来说可以通过色差,棱角等特征将字符还原出来。

需要稍微提一句,在复杂图像或对比不强烈的图片中“还原边界”的能力是需要用到抽象(第二层)和逻辑推理(第四层)能力的,所以会显得稍微慢一些。

除了上述三个辅助能力外,听觉,味觉等也是略微有助于识别能力的建立,在此就不仔细描述了。立体投射、聚焦和边界判定这三个能力是人类识别练习中的秘密助手,通过观察幼儿的动作我们可以发现,一开始幼儿去触摸某些物体时候会失误,摸不到,一方面是因为他的身体协调还不完善,另一方面其实也是他的距离感还没有建立完整(距离感很大程度是通过手臂长度来推测的)。

同时,幼儿在摸索物体的时候也需要经历光与影的考验。比如,如同小猫一样,幼儿也会尝试去抓住图像或影子,直到他最后明白这并不是一个实体,他就不会再去抓了。在这两个秘密助手的帮助下,大脑最终锻炼出一个多重输入的经验物体识别能力。

幼儿时期练习识别能力的一个重要结果是利用实体物品建立“几何形状”的概念,这个概念在下一个章节:抽象,中起到了非常基础的作用。

现在的人工智能图像识别,主要工作就是在找出图片中待识别物体的边界,可以说程序员科学家们做了大量的研发,就是为了使AI可以在平面输入的时候自动勾勒出需要识别的物体的边界,进而定义他自己识别的是什么东西。所以现在AI是在超级巨量的纯粹平面图片的训练下建立起边界判定能力,而且已经超过了人类,相当于有的人用一个眼睛看东西视力居然还比你好,他要是睁开两只眼睛呢!所以AI识别的如果能够配上光场照相机,预计可以获得比现在更高一个数量级的识别能力。

下一篇将详细介绍人肉智能的第二个功能组成:抽象。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180519G0DJ4300?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券