ViPeD说明
ViPeD数据集是基于GTA V的虚拟pedestrian detection数据集。该数据集只有person类别,每一个seq为一个总共有900帧的视频,每一帧为1920 × \times × 1080的图片。
为了便于该数据集进行目标检测网络的计算,现每10帧筛选出数据,同时将图像的大小从1920 × \times × 1080等比例降低为640 × \times × 360.(此处需要等比例缩放,因为label中的bounding box 已经归一化为了相对位置)png2jpg.py 实现了该功能。
筛选完图像后,需要对标注的label文件进行同样每10帧的筛选。此处是具体的文本处理过程。txt_filter.py实现了该功能。
#png2jpg.py
import cv2
import os
def png2lowjpg(in_path,out_path,new_dim):
imgs = os.listdir(in_path)
imgs = [img for img in imgs if img