ViPeD数据集预处理（降低图片分辨率，隔帧等间隔过滤）

幻灵H_Ling

于 2020-12-15 17:16:44 发布

阅读量596

点赞数

分类专栏： person detection 文章标签：计算机视觉 python 深度学习 opencv

本文链接：https://blog.youkuaiyun.com/weixin_42716570/article/details/111224296

版权

ViPeD数据集源于GTA V，专用于虚拟行人检测。包含900帧、1920 × 1080像素的视频序列。预处理步骤包括每10帧选取一帧，等比例缩放图片至640 × 360以优化深度学习目标检测计算，并同步处理标注的label文件。此过程分别由png2jpg.py和txt_filter.py脚本完成。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ViPeD说明

ViPeD数据集是基于GTA V的虚拟pedestrian detection数据集。该数据集只有person类别，每一个seq为一个总共有900帧的视频，每一帧为1920 $\times$ 1080的图片。

为了便于该数据集进行目标检测网络的计算，现每10帧筛选出数据，同时将图像的大小从1920 $\times$ 1080等比例降低为640 $\times$ 360.（此处需要等比例缩放，因为label中的bounding box 已经归一化为了相对位置）png2jpg.py 实现了该功能。

筛选完图像后，需要对标注的label文件进行同样每10帧的筛选。此处是具体的文本处理过程。txt_filter.py实现了该功能。

#png2jpg.py

import cv2
import os

def png2lowjpg(in_path,out_path,new_dim):
    
    imgs = os.listdir(in_path)
    imgs = [img for img in imgs if img

最低0.47元/天解锁文章