计算机视觉之目标跟踪

本文介绍了计算机视觉中的目标跟踪,分为单目标跟踪和多目标跟踪两个部分。在单目标跟踪中,讨论了滑动窗口、粒子滤波等方法,以及生成式、判别式和Bag of Patch三种评分策略。对于多目标跟踪,探讨了Data association问题,并对比了ABT和CFT两种方法。匈牙利算法被提出用于解决最佳匹配问题,以实现全局最优的跟踪效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

跟踪定义:
在一系列的图像中,标注出关于运动物体的可能位置。

一、单目标跟踪

产生候选box方法:
滑动窗口(穷举法)即目标附近所有可能的样本作为候选样本
由于两帧图像之间目标的位移不会发生明显的变化,因而,可以估计在下一帧物体可能出现的位置,在附近产生多个候选box。
粒子滤波(Particle Filter)

如何为候选样本评分:
三种方式!
1.生成式:模板匹配(需要估计运动模型的),得到patch描述(可以是灰度像素值,梯度方向直方图,HOG),估计下一帧图像可能出现的位置,得到一系列的patch并获取其描述,计算相似度。

2.判别式(针对前景和背景训练分类器,把跟踪问题视为分类问题,需要计算特征和分类器):

在线学习
仅使用一个图像块来训练分类器(输入正样本和负样本),相对于离线学习来说,仅使用少量的训练集,即先前帧的box。

多示例学习(Multiple Instance Learning)
构造正样本包!即用确定的目标box和在其周围像素进行采样得到的patch来形成包(由于包含确定目标的box,肯定是正样本包啦),通过正样本包和负样本来训练分类器。通过构造样本包可以有效地防止形变、遮挡、位置偏移的问题

在这里插入图片描述
3.Bag of Patch(使用KNN获取目标位置,不用训练分类器,但依旧使用了前一个帧中的正负样本)
对于预测图像,获取多个patch(根据运动模型在预测位置周围获取),同前序帧的patch和label做KNN,便可得到预测对象出现的位置。
在这里插入图片描述

更新分类器:
仅使用前一帧的跟踪结果来训练分类器有可能跟丢了,提出了anc

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值