行人重识别 MSMT17数据集描述

MSMT17是一个大型的行人重识别数据集,它由15个摄像头捕获,涵盖多场景多时段,共计180小时的视频。该数据集包括4101个行人的126441个包围框,使用Faster R-CNN进行行人检测,并由人工进行标注。相比早期数据集,MSMT17具有更多行人、包围框和摄像头数量,且包含复杂场景和光照变化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        最近的CVPR2018会议上,提出了一个新的更接近真实场景的大型数据集MSMT17,即Multi-Scene Multi-Time,涵盖了多场景多时段。

 

早期数据集的缺点

(1)和实际的监控网络相比,数据集中行人和摄像头的数目不多;

(2)大多数数据集仅覆盖单一场景;

(3)时间跨度短,没有显著的光照变化;

(4)行人检测器有昂贵的人工标注或过时的DPM模型实现。

 

MSMT17数据集描述

        数据集采用了安防在校园内的15个摄像头网络,其中包含12个户外摄像头和3个室内摄像头。为了采集原始监控视频,在一个月里选择了具有不同天气条件的4天。每天采集3个小时的视频,涵盖了早上、中午、下午三个时间段。因此,总共的原始视频时长为180小时。

        基于Faster RCNN作为行人检测器,三位人工标注员用了两个月时间查看检测到的包围框和标注行人标签。最终,得到4101个行人的126441个包围框。和其它数据集的对比以及统计信息如下图所示。

MSMT17数据集的特点如下:

(1)数目更多的行人、包围框、摄像头数;

(2)复杂的场景和背景;

(3)涵盖多时段,因此有复杂的光照变化;

(4)更好的行人检测器(faster RCNN)

 

评估协议

        按照训练-测试为1:3的比例对数据集进行随机划分,而不是像其他数据集一样均等划分。这样做的目的是鼓励高效率的训练策略,由于在真实应用中标注数据的昂贵。

        最后,训练集包含1041个行人共32621个包围框,而测试集包括3060个行人共93820个包围框。对于测试集,11659个包围框被随机选出来作为query,而其它82161个包围框作为gallery.

        测试指标为CMC曲线和mAP. 对于每个query, 可能存在多个正匹配。

 

参考

[1] 数据集地址(含下载链接) https://www.pkuvmc.com/publications/msmt17.html

[2] 论文 Person Transfer GAN to Bridge Domain Gap for Person Re-Identification

 

 

### 如何下载和获取 MSMT 数据集 MSMT17 是一种广泛应用于行人重识别 (Re-ID) 领域的数据集。为了成功获取该数据集,可以按照以下方法操作: #### 方法一:通过官方 GitHub 提供的资源 如果希望获得最新版本的 MSMT17_V1 数据集,可以通过 zhedong 的 Re-ID 基线项目页面找到相关说明[^2]。该项目提供了详细的指南来帮助用户准备数据集环境。具体而言,可以从 OneDrive 下载链接访问完整的数据包: ```plaintext https://pkueducn-my.sharepoint.com/:u:/g/personal/shiyongjie_pku_edu_cn/EQ9BMxrVtuRBt6fYZ6sW4ScB5WH-NXSn_pXkU87CQaU7Uw?e=LKFEOY ``` 此链接包含了训练 (`train`) 和测试 (`test`) 文件夹以及一系列 `.txt` 文本文件,这些文件定义了数据集中图像的具体分类标签。 #### 方法二:本地构建与验证 对于已经拥有基础版 MSMT17 数据集但缺少 V1 版本特定文件的情况,建议重新校验目录结构是否满足标准需求[^4]。通常情况下,正确的目录应包含以下几个部分: - `bounding_box_train`: 训练集图片; - `bounding_box_test`: 测试集图片; - `query`: 查询图片集合; - 多个描述样本分布关系的 TXT 文件(如 `list_gallery.txt`, `list_query.txt` 等)。 上述组件共同构成了完整的 MSMT17_V1 数据集框架。 #### 方法三:其他公开渠道补充材料 除了直接利用网络存储服务外,还可以尝试借助第三方学术平台寻找额外的支持资料。例如 NYU Depth v2 数据库虽然主要面向深度估计任务,但也可能间接提供某些预处理工具或脚本来辅助完成类似目标[^1]。不过需要注意甄别其适用范围以免混淆用途。 最后提醒,在实际应用过程中务必遵循各数据源所规定的版权协议条款。 ```python import os def verify_dataset_structure(base_path): required_folders = ['bounding_box_train', 'bounding_box_test', 'query'] missing_items = [] for folder in required_folders: if not os.path.exists(os.path.join(base_path, folder)): missing_items.append(folder) txt_files = [ f for f in os.listdir(base_path) if os.path.isfile(os.path.join(base_path, f)) and f.endswith('.txt') ] return { "missing": missing_items, "text_files_found": txt_files } result = verify_dataset_structure("/path/to/msmt17_v1") print(result) ``` 以上代码片段可用于快速检查指定路径下的 MSMT17_V1 数据集完整性,并报告缺失项及存在的文本配置列表。
评论 35
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值