<数据集>Visdrone数据集<目标检测>

数据集格式:VOC+YOLO格式

图片数量:8629张

标注数量(xml文件个数):8629

标注数量(txt文件个数):8629

标注类别数:10

标注类别名称:['pedestrian','people','bicycle','car','van','truck','tricycle','awning-tricycle','bus','motor']

序号类别名称图片数框数
1car8178187005
2motor551640378
3people522638560
4pedestrian7083109187
5awning-tricycle16044377
6tricycle22706387
7bicycle349613069
8truck456716284
9van653732702
10bus29929117

使用标注工具:labelImg

标注规则:对类别进行画水平矩形框

图片示例:

9025daf96d4e450280ee2754d479a808.png

d25e1da44d84421397dc7a34dbe24fec.png

标注示例:

d19b8a1ed5634871a5fa3483c6f7caa3.jpeg

dfa61acbc0de4132955fb6bbd70eb3b4.jpeg

### VisDrone 数据集概述 VisDrone 是一个大规模无人机(UAV)捕捉的数据集,旨在促进视觉目标检测、跟踪和其他计算机视觉任务的发展。该数据集包含了丰富的场景变化和复杂的物体交互情况。 ### 下载与解压 对于希望使用此数据集的研究人员来说,可以从官方渠道获取最新版本的数据集[^1]: ```python import os data_path = 'path/to/visdrone/dataset' ``` 除了通过官网下载外,还提供了一个百度网盘链接供国内用户更便捷地访问资源[^2]: - 链接:<https://pan.baidu.com/s/1N1IuBkoX2jd_6x4kscSDKg> - 提取码:l070 下载完成后应将其放置于项目中的 `datasets` 文件夹下以便后续操作。 ### 数据集结构 解压缩后的 VisDrone 数据集通常具有如下目录结构: ``` VisDrone/ ├── annotations/ │ ├── train/ │ └── val/ └── images/ ├── train/ └── val/ ``` 其中: - `annotations/train` 和 `annotations/val` 存储着对应图像的标注文件; - `images/train` 及 `images/val` 则分别存放训练集和验证集中每张图片的实际内容。 ### 使用说明 为了方便研究人员快速上手,在 YOLOv5 训练过程中特别准备了一套完整的工具链来简化流程[^3]。其中包括但不限于以下几个方面: #### 自动化脚本支持 针对 VisDrone 特有的格式特点开发了一系列辅助程序,可以实现自动化的数据准备工作流,比如批量转换标签格式等,从而使得原始数据更容易被不同框架所接受。 #### 示例代码片段 这里给出一段简单的 Python 代码用来展示如何读取并显示一张来自 VisDrone 的样本图像及其对应的边界框信息: ```python from PIL import Image, ImageDraw import pandas as pd def visualize_sample(image_file, annotation_file): img = Image.open(image_file) draw = ImageDraw.Draw(img) df = pd.read_csv(annotation_file, header=None, names=['x', 'y', 'w', 'h', 'score', 'object_category', 'truncation', 'occlusion']) for _, row in df.iterrows(): box = (row['x'], row['y'], row['x'] + row['w'], row['y'] + row['h']) draw.rectangle(box, outline="red", width=2) return img image_path = os.path.join(data_path, "images/train/xxx.jpg") annotation_path = os.path.join(data_path, "annotations/train/xxx.txt") visualized_image = visualize_sample(image_path, annotation_path) visualized_image.show() ``` 上述函数接收两个参数——分别是某幅具体照片的位置以及相应的注释文档位置;它会加载指定的照片,并在其上面绘制出所有标记出来的对象区域,最后返回修改过的图像实例以供查看。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值