人脸识别系统评估:原理、指标与误差分析
1. 人脸识别研究现状
近年来,人脸识别研究显著升温,这得益于多个因素的共同作用。先进机器学习算法的发展、免费且强大的软件实现、运行速度更快的 GPU 处理器、大量网络抓取的人脸图像数据库、开放的性能基准以及丰富的人脸识别文献,都推动了该领域的进步。
新算法的开发旨在实现对姿势、光照和表情变化的不变性,以适应新闻摄影和社交媒体图像的特点。最初的研究使用相对较少个体(约 $10^4$)的大量图像来学习不变性,后来训练使用了更大的群体(约 $10^7$)。不过,一些基准测试任务,如使用 EER 指标的 LFW,代表的是在非常高的误匹配率下的一对一验证,相对容易。而更大规模的识别基准(如 Megaface)的主要指标——排名第一的命中率,与大规模政府人脸识别应用(如证件去重、执法和情报搜索)所需的高阈值判别任务存在差异。
技术进步大幅降低了识别错误率。NIST 的人脸识别供应商测试表明,领先的商业算法在 2018 年的相同肖像图像识别任务(图库大小为 160 万)中产生的假阴性比 2013 年少 20 倍,而在 2010 - 2013 年期间,错误率仅下降了一半。这表明基于 CNN 的算法能够同时实现不变性和判别性,主要商业开发者已将现有算法集成或替换为基于卷积神经网络(CNN)的算法。
2. 评估的重要性与目标
评估是人脸识别进展的基础,即量化准确性以评估算法是否优于其前身和竞争对手。大多数评估在开发者的实验室进行,与研究紧密相关。在大学环境中,同行评审期刊要求根据已发布的基准测量准确性;在商业环境中,结果很少公开。过去,开发者因缺乏合适的图像数据集而受挫,但近年来,互联网上的人脸图像(尤其是摄影、新
超级会员免费看
订阅专栏 解锁全文
23万+

被折叠的 条评论
为什么被折叠?



