计算机视觉进入了一个瓶颈期,人们有能力让计算机视觉在特定条件下接近或者说超过人类的辨识能力。但是正如语音识别技术一样,这是企业的障眼法,真正意义上的辨识能力与人眼相去甚远。
尽管人脸识别技术已经广泛应用于支付等领域,并拥有98%的成功率,然而这一成功率建立在特定情境下,光线、遮挡、角度严格限制,你不能指望一个人工自能机器人去思考他应该怎么去看,他只是在人们设定的规则下按部就班。
谷歌野心勃勃的神经网络项目后院活动部曾经介绍过,这个系统能幻化出从不存在的人脸。尽管具有延伸的能力,但是在实验条件发生改变的时候,比如你必须保持摆正姿势才能有效识别。
这和人类的视觉能力差距不小,不仅在2D领域,在3D领域上更是如此,如何理解一个命令,并且在三维空间中识别各个角度的物体,并以合适的姿势和力度配合视觉能力完成指令,这是计算机无法自己自发思考完成的。当然通过分布步骤可以实现一步步完成“把大象塞进冰箱里”的动作。
困难的是,人工智能难以做到人类的推理推断和决策能力。这或许是强人工智能一直未曾实现的原因。
领取专属 10元无门槛券
私享最新 技术干货