目标检测——行人/人体检测数据集

由于最近做项目需要检测行人,包括检测红外光和可见光两种状态的行人,通过网上购买、爬虫等方式收集了大量的行人相关的数据集,数据集经过清洗和人工筛选,进而用于训练YOLO系列相关的检测模型。


1. 红外光人体数据集-——IR1

这是清洗了的红外数据集,其中包括3493个数据集,标签格式为YOLO格式,能够直接用于YOLO系列模型的训练,类别只有person一个类别。

数据集图片

 数据集标签

可视化标签

资源下载链接

红外光人体目标检测数据集包括:3493个图片(4dc9-JPEGImages)YOLO格式标签(4dc9-Txt-Label)可视化检测结果(4dc9-JPEGImages-results)资源-优快云文库


2. 红外光人体数据集——IR2

清洗了的红外数据集,其中包括9045个数据集,数据集的标签格式为YOLO格式,能够直接用于YOLO系列模型的训练,只有person一个类别。

数据集图片

 数据集标签

可视化标签 

资源下载链接

IR2红外光人体检测数据集-YOLO格式资源-优快云文库


3. 红外光人体数据集——IR3

红外行人数据集,其中包括14623个数据集,数据集的标签格式为YOLO格式,能够直接用于YOLO系列模型的训练,只有person一个类别。

数据集图片

数据集标签

 可视化标签

资源下载链接

图像资源IR3红外光人体检测数据集-YOLO格式-图像数据(1/2)资源-优快云文库

IR3红外光人体检测数据集-YOLO格式-图像数据(2/2)资源-优快云文库

标签资源IR3红外光人体检测数据集-YOLO格式-标签资源-优快云文库

可视化资源IR3红外光人体检测数据集-YOLO格式-可视化标签图像数据(1/4)资源-优快云文库

IR3红外光人体检测数据集-YOLO格式-可视化标签图像数据(2/4)资源-优快云文库

IR3红外光人体检测数据集-YOLO格式-可视化标签图像数据(3/4)资源-优快云文库

IR3红外光人体检测数据集-YOLO格式-可视化标签图像数据(4/4)资源-优快云文库


4. 红外光人体数据集——IR4

清洗后的红外行人数据集,其中包括2921个数据集,数据集的标签格式为YOLO格式,能够直接用于YOLO系列模型的训练,只有person一个类别。

数据集图片

数据集标签

可视化标签

 

资源下载链接

图像资源IR4红外光人体检测数据集-YOLO格式-图像数据(1/2)资源-优快云文库

IR4红外光人体检测数据集-YOLO格式-图像数据(2/2)资源-优快云文库

标签资源IR4红外光人体检测数据集-YOLO格式-数据标签资源-优快云文库

可视化资源IR4红外光人体检测数据集-YOLO格式-可视化标签图像数据(2/2)资源-优快云文库

IR4红外光人体检测数据集-YOLO格式-可视化标签图像数据(2/2)资源-优快云文库


红外人体检测数据集不够解决方案

如果红外光的人体检测数据集不够,可以用以下的代码,可以把以下的可见光人体数据集转化为伪红外的人体检测数据集。相关的python代码如下:

import cv2
import numpy as np
import os
import tqdm

def rgb_to_pseudo_infrared(image):
    # 将图像从BGR转换为HSV
    hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)
    
    # 提取亮度通道(V通道)
    v_channel = hsv_image[:, :, 2]
    
    # 归一化亮度通道到0-255
    normalized_v = cv2.normalize(v_channel, None, 0, 255, cv2.NORM_MINMAX)
    
    # 反转亮度通道以模拟红外效果
    pseudo_infrared = 255 - normalized_v
    
    return pseudo_infrared

if __name__ == '__main__':
    # 需修改, RGB图像存放路径
    dir_path = r'D:\DataSets\RGB_Body_Detection_Datasets\train2017_imgs'
    # 需修改, 伪红外图像存放路径
    save_path = r'D:\DataSets\Infrared_Body_Detection_Datasets\FAKE_INFRARED\IMAGES_COCO'
    for file_name in tqdm.tqdm(os.listdir(dir_path)):
        # 构造输入图像路径
        input_image_path = os.path.join(dir_path, file_name)
        # 读取输入的RGB图像
        input_image = cv2.imread(input_image_path)

        # 转换为伪红外灰度图
        infrared_image = rgb_to_pseudo_infrared(input_image)

        # 构造输出图像路径
        output_image_path = os.path.join(save_path, file_name)

        # 保存结果
        cv2.imwrite(output_image_path, infrared_image)
        print(f'{file_name} done!')

代码解释:

将图像从BGR转换为HSV,提取亮度通道(V通道),归一化亮度通道到0-255,反转亮度通道以模拟红外效果,返回伪红外图像 

转换效果如下:

原图:

转换后的效果: 


5. 可见光人体检测数据集——Daimler行人数据集

数据集介绍

该数据库采用车载摄像机获取,分为检测和分类两个数据集。检测数据集的训练样本集有正样本大小为18×36和48×96的图片各15560(3915×4)张,行人的最小高度为72个象素;负样本6744张(大小为640×480或360×288)。测试集为一段27分钟左右的视频(分辨率为640×480),共21790张图片,包含56492个行人。分类数据库有三个训练集和两个测试集,每个数据集有4800张行人图片,5000张非行人图片,大小均为18×36,另外还有3个辅助的非行人图片集,各1200张图片。

数据集图片

资源下载链接

Daimler Mono Ped. Detection Benchmark


6. 可见光人体检测数据集——TUD行人数据集

数据集介绍

TUD行人数据库为评估运动信息在行人检测中的作用,提供图像对以便计算光流信息。训练集的正样本为1092对图像(图片大小为720×576,包含1776个行人);负样本为192对非行人图像(手持摄像机85对,车载摄像机107对);另外还提供26对车载摄像机拍摄的图像(包含183个行人)作为附加训练集。测试集有508对图像(图像对的时间间隔为1秒,分辨率为640×480),共有1326个行人。Andriluka等也构建了一个数据库用于验证他们提出的检测与跟踪相结合的行人检测技术。该数据集的训练集提供了行人的矩形框信息、分割掩膜及其各部位(脚、小腿、大腿、躯干和头部)的大小和位置信息。测试集为250张图片(包含311个完全可见的行人)用于测试检测器的性能,2个视频序列(TUD-Campus和TUD-Crossing)用于评估跟踪器的性能。

数据集图片

资源下载链接

Multi-Cue Onboard Pedestrian Detection - Max Planck Institute for Informatics


7. 可见光人体检测数据集——USC行人数据集

数据集介绍

该数据库包含三组数据集(USC-A、USC-B和USC-C),以XML格式提供标注信息。USC-A[Wu, 2005]的图片来自于网络,共205张图片,313个站立的行人,行人间不存在相互遮挡,拍摄角度为正面或者背面;USC-B的图片主要来自于CAVIAR视频库,包括各种视角的行人,行人之间有的相互遮挡,共54张图片,271个行人;USC-C有100张图片来自网络的图片,232个行人(多角度),行人之间无相互遮挡。

数据集图片

资源下载链接

USC Iris Computer Vision Lab – USC Institute of Robotics and Intelligent Systems


8. 可见光人体检测数据集——INRIA Person行人数据集

 无法访问网站

数据集介绍

INRIA Person数据集是一个用于行人检测的人员图像数据集。它包含614张用于训练的人员检测图像和288张用于测试的图像。

数据集图片

资源下载链接

https://pascal.inrialpes.fr/data/human/


9. 人体检测数据集——MIT数据库

 无法访问网站

数据集介绍

该数据库为较早公开的行人数据库,共924张行人图片(ppm格式,宽高为64×128),肩到脚的距离约80象素。该数据库只含正面和背面两个视角,无负样本,未区分训练集和测试集。Dalal等采用“HOG+SVM”,在该数据库上的检测准确率接近100%。

资源下载链接

http://cbcl.mit.edu/software-datasets/PedestrianData.html



博客资源说明 

由于csdn上传限制,只能上传低于1000MB的资源,因此只能把数据文件拆分多个文件上传,下载完所有相关数据合并为一个文件即可。


相关代码工具 

可视化YOLO标签链接

目标检测-可视化YOLO格式标签_yolo标签可视化-优快云博客

 数据集划分链接

目标检测-数据划分(YOLO格式)_yolo数据集划分代码-优快云博客

数据集格式转换

目标检测-数据处理,YOLO2JSON、VOC2YOLO、YOLO2VOC、JSON2YOLO-优快云博客

### 行人检测数据集概述 行人检测作为计算机视觉中的一个重要领域,依赖于高质量的数据集来训练和评估模型。多个知名的数据集被广泛应用于这一研究方向,这些数据集不仅提供了丰富的图像资源,还包含了详细的标注信息。 #### 常见的行人检测数据集及其特点 - **Caltech Pedestrian Detection Benchmark** 这一数据集由加州理工学院提供,包含超过250,000帧视频片段,其中约有35,000个行人实例得到了精确标注。该数据集的特点在于其涵盖了多种环境条件下的场景变化,使得基于此数据集开发出来的算法能够更好地适应实际应用需求[^1]。 - **Cityscapes Dataset** Cityscapes专注于城市街景的理解,特别是针对自动驾驶汽车的应用背景设计而成。它收集了来自50个城市的不同天气状况下拍摄的照片,并对每张图片进行了像素级语义分割标记,其中包括大量的行人样本。这有助于提升模型对于复杂交通环境中行人的识别能力。 - **KITTI Vision Benchmark Suite** KITTI是由德国卡尔斯鲁厄理工大学与丰田美国技术研究院共同创建的一个大型真实世界驾驶场景数据库。除了车辆外,也记录了大量的行人活动情况。通过立体相机、激光雷达等多种传感器获取的数据可以用来构建多模态感知系统,在提高行人检测精度方面具有重要意义。 #### 数据下载方式 为了方便研究人员访问上述提到的各种数据集,Kaggle平台提供了便捷的接口和服务: ```python import kaggle kaggle.api.authenticate() datasets = ['caltech-pedestrian-detection-benchmark', 'cityscapes', 'kitti'] for dataset in datasets: kaggle.api.dataset_download_files(dataset, path='./data/', unzip=True) ``` 这段Python脚本展示了如何利用`kaggle`库自动完成认证并批量下载所需的数据文件到本地指定目录中。 #### 应用案例分析 在机器学习尤其是深度学习框架的支持下,借助大规模标注良好的行人数据集,已经实现了许多创新性的成果。例如,卷积神经网络(CNNs)已被证明是非常有效的特征提取工具;而区域提议网络(RPN)+Fast R-CNN架构则进一步提升了目标定位准确性。此外,随着硬件性能的进步以及新算法不断涌现,实时处理成为可能,从而推动了智能监控、辅助驾驶等一系列应用场景的发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张飞飞飞飞飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值