据美国国家标准与技术研究院(NIST)研究报告称,在过去5年内,脸部识别技术的准确率已大幅提升。
事实上,这项技术已经经历了一场“工业革命”,使得某些算法在搜索数据库和查找匹配项方面比其他算法高出20倍,这些数字来自于NIST发布的“当前脸部识别供应商测试”结果。NIST测试了由45个不同供应商开发的127种算法。这些算法被该机构称为“行业的大部分”,它们使用一个主要数据库,其中包含来自具有良好姿态的1230万个人的2660万张肖像照片。由于照片的质量很高,最准确算法的匹配识别错误率仅为0.2%。作为对比,同样的测试在2014年至少有4%的失败率,而2010年的失败率为5%。
NIST还在一个“原生图像”数据库上测试了这些算法,该数据库包含来自新闻摄影和业余摄影的人脸图像。这一批算法中表现最好的有来自微软、IDEMIA和中国人脸识别公司依图开发的算法。
改进的秘诀是什么?NIST表示,其中之一是广泛采用了卷积神经网络,这是对2014年脸部识别和机器学习技术的一个改进。报告写道:“精度的提高主要得益于将先前的方法与基于深度卷积神经网络的方法进行集成或完全替换。”因此,人脸识别经历了一场工业革命,算法对质量差的图像的容忍能力越来越高。无论革命是否继续或已经进入一个更高级的阶段,随着机器学习体系结构的进一步发展,更大的数据集得以组装,基准得到进一步利用,我们可以期望看到更多的成果。”
NIST计算机科学家、报告的作者之一Patrick Grother在一份声明中表示:“该测试显示了行业对卷积神经网络的大规模应用,这在五年前并不存在。由大约25名开发人员开发的算法胜过了我们在2014年报告的最准确算法。”
但是有一个针对所有改进的重要警告——性能分布不均匀。报告指出:“识别准确率在很大程度上取决于算法,更常见的是依赖于算法的开发者。在特定情况下的识别错误率有时是几千分之一,有时会超过百分之五十。因此,一些开发人员的算法非常没有竞争力,不应该部署。”换言之,在许多情况下,最精确的算法要比另一些算法精确得多。“这意味着在选择新一代软件时,你需要适当地考虑准确性,”Grother警告说。
此外,即使性能良好的算法也难以应对某些自然产生的挑战,比如质量差的照片、衰老的面孔甚至双胞胎。NIST测试的高性能算法中没有一个能正确识别双胞胎。
在2019年,NIST计划再发布两份关于脸部识别准确度的报告—一份详述了由49位开发人员提交的另外90种算法的结果,另一份是关于“脸部识别中的人口相关性”的报告。
随着脸部识别算法的广泛应用,准确性成为一个很大的关注点。美国一群民主党议员给亚马逊CEO Jeff Bezos写了一封信,表达了他们对亚马逊Rekognition软件的准确性(或缺乏准确性)的“严重关切”:“脸部识别技术有朝一日会成为执法人员保护美国公众和维护公共安全的有用工具。然而,此时,我们对此类产品抱有严重关切,因为此类产品存在重大的准确性问题,给有色人群带来了不当负担,并可能扼杀美国人在公共场合行使《第一修正案》权利的意愿。”