最近在做一个无人机车辆巡检的项目,需要用到大量的汽车相关的视频图片数据,前几天参考一些资料训练了bdd100k数据集,但是无人机巡检犹豫在高空中拍摄,清晰度不高,同时角度是俯视,这种角度的数据很难找,不过做实验阶段先找开源的数据吧,同时需要自己标注大量的数据进行补充。这里将BITVehicle_Dataset数据集与bdd100k数据集联合训练,但是BITVehicle_Dataset数据集提供的标注文件是一个matlab的mat文件,处理bdd100k数据集时已经用python实现了json格式到xml格式的转换,并从xml格式数据中组装darknet需要的数据格式(txt)格式,BITVehicle_Dataset数据集是{'Bus', 'Truck', 'SUV', 'Microbus', 'Sedan', 'Minivan'}这几种车型,bdd100k力度比较粗,没有细化到品牌,我这里的解决办法是在matlab中先将mat格式的标注数据转为voc格式,然后再用python从xml中提取标注框的信息,生成最终的训练数据。类别的转换使用一个python中的映射字典完成,这样后面需要用到BITVehicle_Dataset数据集时更加方便
下面是matlab提取BITVehicle_Dataset标注信息,转成xml的代码,已经带有详细注释。其他的脚本陆陆续续放上来,备忘。每天写一点吧项目还没做完。
data=load('./BITVehicle_Dataset/VehicleInfo.mat')
cars=data.VehicleInfo;
for n=1:length(cars)
n;
car=cars(n);
%%
%每一辆车新建一个xml文件存储车的信息
carName=car.name;
%图片的高度
carHeight=car.height;
%图片的宽度
carWidth=car.width;
%新建xml文件
annotation = com.mathworks.xml.XMLUtils.createDocument('annotation');
annotationRoot

本文介绍了一项无人机车辆巡检项目的实践经验,分享了如何整合并利用不同格式的数据集(如MATLAB的mat文件和JSON文件)进行目标检测模型训练的过程。
最低0.47元/天 解锁文章
5154





