基于视频的目标检测

该博客介绍了基于视频的目标检测技术,包括T-CNN和Deep Feature Flow。T-CNN利用静态图片检测、上下文抑制和运动传播等步骤实现目标检测。Deep Feature Flow则通过关键帧特征提取和帧间传播来提高实时视频应用的效率。尽管文章认为这些方法存在局限,但它们为视频目标检测提供了一定的思路。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一. 提出背景

       目标检测在图像处理领域有着非常大的占比,过去两年,深度学习在Detection的持续发力,为这个领域带来了变革式的发展:一方面,从 RCNN 到 Fast RCNN,再到 Faster RCNN,不断刷新 mAP;另一方面,SSD、YOLO 则是将性能提高到一个非常高的帧率。

       对于视频来讲,相邻帧目标之间存在 明显的上下文关系,这种关系在技术上的表现就是 Tracking,研究过跟踪的童鞋都应该知道 经典算法 TLD,通过 Tracking-Learning-Detection 学习目标的帧间变换,并进行 Location。

       基于视频的目标检测 要解决的是同样的问题,因为 变形、遮挡、运动Blur 等因素导致目标 在 中间帧无法检测到(Appearence 发生很大变化),可以从下图看到,基于 still-image 的方法在某些帧的检测置信度很低。

       

       VID(object-detection-from-video) 在2015年已成为一个 Challenge 方向,主要思路是结合帧间的 Context 信息、Tracking信息,接下来我们要讲的算法 TCNN。

       论文名称: T-CNN: Tubelets with Convolutional Neural Networks for Object Detection from Videos


二. T-CNN

      论文下载:arvix

      代码下载:Github

      闲话不说,直接给出框架图:

        

        算法分为四个步骤&

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值