人脸识别中的评估方法
1 引言
人脸识别技术在过去二十年间取得了显著的进步,尤其是在受控环境中使用静态正面图像时。错误率从早期的较高水平下降到了2006年人脸识别供应商测试(FRVT)和多重生物特征评估(MBE)中报告的1%以下,误接受率为1000分之1。这些进展的背后是严谨的实验设计和评估方法,确保了人脸识别系统的性能可以被客观衡量。
核心在于实验协议的设计与实施。该协议详细规定了评估的具体步骤以及结果的计算方式。本文将聚焦于FERET和FRVT 2002协议,它们为后来的FRVT 2006和MBE 2010评估奠定了基础。这些协议不仅用于评估人脸识别算法,也为其他生物识别技术提供了宝贵的参考。
2 性能度量
在人脸识别和生物识别领域,性能通常通过三个标准任务来报告:验证、开放集识别和闭集识别。每个任务都有其独特的性能度量标准。这三个任务之间有着密切的关系,其中开放集识别是更为通用的情况。
2.1 生物识别样本
生物识别系统依赖于生物识别样本进行工作,这些样本记录了个人的特征,使得该人可以被识别。例如,面部图像或指纹都可以作为生物识别样本。一个生物识别样本可能由多个记录组成,比如同时获取的几张面部图片或一张面部图片加上一个指纹。
为了计算性能,需要三组图像:一组包含系统已知人员的生物识别样本(称为画廊G),另外两组是探测集。探测集分为两类:一类包含画廊中人员的生物识别样本(PG),另一类包含不在画廊中的人员的生物识别样本(PN)。
2.2 闭集识别
闭集识别是自动人脸识别社区的经典性能度量。在此任务中,探测集中的生物识别样本总是画廊中的某个人。因此