使用TLD算法为深度学习准备数据集

本文介绍了如何利用TLD算法来高效地制作深度学习目标跟踪的数据集,通过修改TLD算法,实现在检测到目标时同时保存图片和XML标签文件,大大简化了数据集的制作过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本篇文章讲的是如何使用TLD算法制作数据集

这个项目呢,其实是我一个大项目的一个分支,我的大项目是要使用深度学习的方法对一个目标进行跟踪,目标是现实生活中的一件物品,在这里我就用一个遥控小车代替。而本篇文章讲的就是如何快速制作这个小车的数据集

我在本项目中使用的是TLD c++代码,在win10下,用VS2013跑起来的,参考的是PASCAL VOC数据集的格式

一、简单介绍PASCAL VOC数据集

PASCAL VOC是一个用于深度学习的数据集,里面有20个类别,可以进行目标分类、位置检测、语义分割等工作。如果使用过的都知道,它的框架里有两个很重要的组成部分,就是原始图片和标签数据,分别存放在JPEGImages和Annotations两个文件夹下,这两份数据是最最原始的数据,也是我们需要手动获取的,不可能写个python脚本自动生成

对于大部分人来讲,生成这些数据都是自己录像、拍照片或是从网上下载图片,然后再使用labelImg去一个一个地生成标签,这样很费事,很累,像我这么懒的肯定不会对着几万张图片一个一个操作了,这么重的体力活明显不适合我

于是我就想有没有一个简单快速的方法来做这件事呢?

二、简单介绍TLD算法

当然是有的呀,没有还写什么博客啊:)

TLD算法是一个传统的目标检测算法,可以用来对目标进行长时间跟踪,亲测可用

这个算法在一开始,让你在屏幕上用鼠标圈一个区域,然后算法就把这个区域当成目标进行长时间的跟踪。该算法由跟踪、检测、学习三个模块组成,其在线学习机制可以有效学习目标的变化

于是我以这套算法为基础,在上面进行修改,让其在检测到目标之后,可以输出jpg图片和xml文件,这样,检测到目标的同时,把目标的原始图片和标签文件都生成了,这部很痛快嘛

而且用CPU跑能达到30fps,要是没有什么意外,我一个小时之内就能生成几万个图片和标签,这数据集一下就做好了!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值