ViPeD数据集预处理(降低图片分辨率,隔帧等间隔过滤)

ViPeD数据集源于GTA V,专用于虚拟行人检测。包含900帧、1920 × 1080像素的视频序列。预处理步骤包括每10帧选取一帧,等比例缩放图片至640 × 360以优化深度学习目标检测计算,并同步处理标注的label文件。此过程分别由png2jpg.py和txt_filter.py脚本完成。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ViPeD说明

ViPeD数据集是基于GTA V的虚拟pedestrian detection数据集。该数据集只有person类别,每一个seq为一个总共有900帧的视频,每一帧为1920 × \times × 1080的图片。

为了便于该数据集进行目标检测网络的计算,现每10帧筛选出数据,同时将图像的大小从1920 × \times × 1080等比例降低为640 × \times × 360.(此处需要等比例缩放,因为label中的bounding box 已经归一化为了相对位置)png2jpg.py 实现了该功能。

筛选完图像后,需要对标注的label文件进行同样每10帧的筛选。此处是具体的文本处理过程。txt_filter.py实现了该功能。

#png2jpg.py

import cv2
import os

def png2lowjpg(in_path,out_path,new_dim):
    
    imgs = os.listdir(in_path)
    imgs = [img for img in imgs if img
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值