众所周知,人类的记忆是不可靠的。人的记忆是不可靠的,因为人的记忆就是这么地不客观,自顾自的上色美化,给予高出事物本身的存在意义。即使是面部识别能力最强的人也只能记得这么多。很难量化一个人的记忆力有多好。例如,没有人真正知道一个人能回忆起多少张不同的面孔,但是基于一个人可能拥有的熟人数量,各种估计往往徘徊在数千张面孔中。
机器不是这样限制的。给右边的计算机一个庞大的人脸数据库,它能够以惊人的速度和精度处理它所看到的,然后识别出它被告知要发现的人脸。这种技能支持了人脸识别软件在二十一世纪的巨大前景。这也是当代监视系统如此可怕的原因。
可是没有主观的感觉,这也是机器的一大缺陷,因为有时候一个人的脸会有表情的变化,一旦表情变化,就很难辨认出这个人是不是原来的那个人了。
问题是,在面部识别方面,机器仍然有局限性。科学家们才刚刚开始了解这些制约因素是什么。为了开始弄清楚计算机是如何苦苦挣扎的,华盛顿大学的研究人员建立了一个庞大的脸部数据库,并测试了各种面部识别算法,随着复杂度的增加。这个想法是在一个数据库上测试这些机器,该数据库包括了将近七十万不同人的多达一百万张不同图像,而不仅仅是一个具有数量相对较少的不同面部的大型数据库,这与其他研究中使用的更加一致。
随着数据库的增长,机器的精度也随之下降。例如,在处理13000个图像数据库时,95%的算法是正确的,而在处理100万个图像时,大约70%的算法是正确的。研究人员说:“这仍然很好,比我们预期的要好得多。”她说。
机器也很难为长得非常相似的人进行调整,要么是多佩尔甘杰,机器很难识别出谁是两个独立的人,要么是同一个人出现在不同年龄的不同照片中,要么是在不同的灯光下,mac是谁。海因不正确地认为是独立的人。
说:“一旦我们扩大规模,算法必须对身份的微小变化敏感,同时对灯光、姿势、年龄保持不变。”
问题是,对于许多想要设计系统以应对这些挑战的研究人员来说,用于实验的大量数据集并不存在——至少,不以学术研究人员能够访问的格式存在。像谷歌和脸谱网这样的训练套装是私人的。没有包含数百万人脸的公共数据库,这是最大的公开可用的面部识别数据集。
研究人员写道:“最终的人脸识别算法应该对数十亿人在数据集中执行。”
《最强大脑》曾经有一次人机挑战赛,就是王昱珩和小度对战,最后还是小度战胜了王昱珩这个“鬼才之眼”,当然,背后有没有黑幕我们不知道,但是小度确实是很棒的,我们在人脸识别的道路上又迈出了一大步。
(作者:荞玥,注:图片来源于网络,如有侵权,请联系作者删除,或在下方评论留言)
领取专属 10元无门槛券
私享最新 技术干货