发生了一些很奇葩的事情,因此我可能要开始学习深度学习了。研究生开始这么久了才开始做深度学习,我真的要担心自己的毕业问题了。好的吧,加油吧。虽然不懂,现在开始吧。
原文地址:【http://davheld.github.io/GOTURN/GOTURN.pdf】
项目地址:【http://davheld.github.io/GOTURN/GOTURN.html】
一篇更详尽的翻译:【https://zhuanlan.zhihu.com/p/25338674?utm_medium=social&utm_source=wechat_session&from=singlemessage&isappinstalled=1】
本文介绍的算法利用深度回归网络,输入为视频流,输出为每一帧中目标的位置。该算法的highlight在于,其利用的是线下的训练,获取目标外观和运动之间的联系,以此来实现对任意(甚至全新、从未见过的)目标的tracking。并且由于网络已经学会了tracking的技巧,因此可以实现100fps的实时应用。
论文第3章主要介绍了该算法。
3.2 网络的输入/输出格式
首先要明确的问题是,what to track,即我们要跟踪的目标是什么。因此,当需求出现的时候,将追踪目标的图像输入进网络中。对于前一帧图像进行剪裁和尺度的调节,使得被追踪目标位于输入图像