Gallery 和probe数据集

本文介绍了人脸识别算法中的Gallery和Probe概念,并详细解释了它们在FERET评估协议中的应用。同时,文章还探讨了如何利用PCA和NN进行人脸识别,以及如何确定降维的具体维度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在人脸识别的算法学习过程中,经常会看到Gallery 和probe两个字眼。 可以粗略的理解,gallery 为训练集,probe为测试

在FERET 评估协议中,算法设计者需要区分三个不同的集合:训练集,参考图像集(或者

原型图像集,gallery set)、测试图像集合(Probe set),其中gallery 集和probe 集供测试时使用。“训

练必须在测试开始之前完成”暗示训练是离线完成的,算法不能根据Gallery 集来调整系统参数。


如他的CVPR 2012论文,用PCA+NN。人脸识别是一个开集问题,人脸验证verification是一个闭集问题。训练样本可能是甲乙,测试样本可能是丙丁。通过训练样本来学习PCA的投影向量W,降到多少维可以搜索,他的CVPR 2012论文PCA是保存98%能量,LDA是降到c-1维。和Ran He已讨论清楚搜索维数的方法:如果降到10维,取W的前10列分别乘以gallery和Probe,再用最近邻分类;类似降到20维,取W的前20列分别乘以gallery和Probe,再用最近邻分类。gallery相当于新的训练集,在Probe上测试。ACCV 2012 tutorial Structured Sparsity via Half-quadratic Minimization的S1-SR的第八页。在The CAS-PEAL large-scale Chinese face database and baseline evaluations (TSMCA 2008)P155也有Training set、 gallery set、Probe set定义


后面两段来自:http://www.cppblog.com/guijie/archive/2008/09/16/61952.html

Surveillance Face Recognition Challenge # ======================== Dataset Structure ========================== # "Training_Set": Ordered by face identities, i.e. each directory contains face images from a specific training identity. There are a total of 5,319 directories each is named by the corresponding identity. The image file name is in format of [PersonID]_[CameraID]_[ImageName].jpg. "Face_Identification_Test_Set" -"gallery": containing 60,294 gallery images from 5,319 test identities (IDs). -"mated_probe": containing 60,423 probe images from 5,319 test IDs, with mated gallery true match images in the "gallery" folder. -"unmated_probe": containing 12,1736 distractor probe face images without mated gallery true match images in the "gallery" folder, i.e. the open-set face identification scenario. -"gallery_img_ID_pairs.mat": the gallery image names and the corresponding face IDs -"mated_probe_img_ID_pairs.mat": the mated probe image names and the corresponding face IDs "Face_Verification_Test_Set": -"verification_images": containing 10,051 images, a subset of the whole test set, randomly sampled to build 5,320 positive and 5,320 negative pairs -"positive_pairs_names.mat": 5320_by_2 cell specifying the image pairs of 5,320 positive pairs -"negative_pairs_names.mat": 5320_by_2 cell specifying the image pairs of 5,320 negative pairs # ======================== Evaluation Instruction ========================== # *** Open-Set Face Identification Evaluation ("Face_Identification_Evaluation") *** 1. Extract features of "gallery" images according to the order defined by "gallery_img_ID_pairs.mat", put them in a matrix called "gallery_feature_map" ([image_number]_by_[feature_dimension]), and save the matrix in a mat file named "gallery.mat" 2. Extract features of "mated_pr
03-10
<think>嗯,用户想了解监控人脸识别挑战赛数据集的架构评估流程,包括训练集、人脸识别测试集人脸验证测试集。首先,我需要回忆一下常见的人脸识别数据集结构,比如LFW、MegaFace等,但监控场景的数据集可能有不同的特点。监控环境下的人脸通常分辨率低、角度多样、光照变化大,所以数据集的结构可能会针对这些挑战设计。 接下来,用户提到的训练集、人脸识别测试集人脸验证测试集。通常训练集用于模型训练,而测试集分为不同的任务。人脸识别(Face Identification)通常是1:N的匹配,即从N个候选中找到正确的身份;而人脸验证(Face Verification)是1:1的比对,确认两张图片是否属于同一个人。因此,数据集的结构应该会分开这两个任务的数据。 需要解释每个部分的数据组成。训练集可能包含大量带有身份标签的图像,每个身份有多张不同条件下的图片。测试集的识别部分可能有查询图像候选库,验证部分可能有正负样本对。评估指标方面,识别常用Rank-1准确率、CMC曲线,验证常用ROC曲线、TAR@FAR等。 还要注意评估流程中的细节,比如是否允许使用外部数据、预处理步骤的限制,以及结果提交的格式。可能有的挑战赛会提供开发集供调参,而最终测试集是隐藏的,防止过拟合。 另外,用户提供的引用文献是关于联合注册表示学习的,可能涉及到如何同时优化注册识别过程,这在监控场景中很重要,因为监控中的人脸可能没有高质量的注册图像。因此,在数据集中可能有模拟真实监控环境的注册图,比如低分辨率或不同角度的照片。 需要确保回答结构清晰,分点说明数据集结构评估流程,并生成相关问题,比如数据预处理方法、挑战赛的常见问题、指标选择依据等。同时,引用提供的文献作为参考,说明实际挑战赛中可能采用的方法。</think>### 监控人脸识别挑战赛数据集结构与评估流程 #### 数据集结构 1. **训练集** - 包含多角度、多光照、低分辨率的监控场景人脸图像 - 每个身份标注唯一ID,通常包含$N$个身份,每个身份$M$张图像 - 示例结构: ``` /train ├── ID_001 │ ├── frame_001.jpg │ └── frame_002.jpg └── ID_002 ├── cam1_003.jpg └── cam2_004.jpg ``` 2. **人脸识别测试集(1:N Identification)** - 查询集(Probe Set):待识别的人脸图像 - 候选库(Gallery Set):注册模板库 - 需计算查询图像与库中所有模板的相似度 3. **人脸验证测试集(1:1 Verification)** - 包含匹配对(正样本)与非匹配对(负样本) - 格式示例:`pair_list.csv` ```csv ID_A/img1.jpg, ID_A/img2.jpg, 1 ID_A/img1.jpg, ID_B/img3.jpg, 0 ``` #### 评估流程 $$ \text{Rank-1 Accuracy} = \frac{\text{正确识别次数}}{\text{总查询次数}} $$ $$ \text{TAR@FAR=0.001} = P(\text{正确接受}| \text{错误接受率}=0.1\%) $$ 1. **人脸识别评估** - 使用CMC曲线(Cumulative Match Characteristic) - 报告Rank-1, Rank-5准确率 - 跨摄像头场景需考虑视角差异[^1] 2. **人脸验证评估** - 绘制ROC曲线(Receiver Operating Characteristic) - 报告TAR@FAR(True Accept Rate at False Accept Rate) - 采用LFW协议时需10折交叉验证 3. **提交要求** - 识别任务:提交相似度矩阵($N \times M$) - 验证任务:提交相似度分数列表 - 禁止使用外部数据增强 §§ 1. 监控场景下如何处理低分辨率人脸图像的识别难题? 2. 跨摄像头人脸识别有哪些特殊评估指标? 3. 如何构建有效的负样本对用于人脸验证训练? 4. 监控数据集中时序信息如何影响识别性能? 5. 遮挡处理在监控人脸评估中的具体考量? : 联合注册与特征学习方法可提升跨视角识别准确率,详见http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8099651
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值