菜鸟看TLD之一:为什么要研究TLD

本文分享了一个月来学习TLD算法的经历与感悟。从初学者的角度出发,探讨了如何成为一个成功的研究者,包括选择问题切入点、分解问题并解决关键部分的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

       算来从小硕接到有关运动跟踪的任务也有接近一个月了,由于运动跟踪这一块不是我们那组的传统方向,万事只能靠自己。入门阶段抓狂了不少日子,没头苍蝇般看了不少论文和源码,抓狂原因无非几个,有论文没代码,有代码的或者太老或者没论文,当然内功太差(包括问题抽取能力,资料搜索能力,算法理解能力等)也是根本原因。忽然有一天,认识网上一朋友,建议我去看看TLD。去google一下果然眼前一亮,首先就是作者的个人主页。前面也找到过不少作者的主页附有论文和源码的,但资料有那么全的,而且还算比较新的(从08-11),加之高水平论文(PAMI,CVPR,BMVC,ICPR,ICIP)还是不多。更令人欣喜的是有那么多牛人在博客中给出了注释和讨论,令人感觉就像在沙漠中走了好多天看到人的感觉一样。于是小硕便一发不可收的陷入了TLD的学习中。

两周的学习,在算法本身之外隐约感觉到了对一个问题有了一点新的感悟,那就是:怎么做一个成功的研究者?首先就是选择问题的切入点,拿追踪问题来说,检测与跟踪向来都是运动跟踪问题两个基本问题,综合两个问题来联合解决运动跟踪问题应该是一般人都可以想到的基本思路,前人也做过一些类似的工作,如(kalman滤波+camshift)。然而,却不是每个人都可以想到通过一个learning模块,来巧妙地利用检测器和跟踪器的双方面信息来综合跟踪物体。切入之后下一步就是像切西瓜似的,要将问题成功分块,分而治之才可以现实地解决问题,在这个过程中,力求对其中关键问题进行解决,以期通过优化模块来优化整体。这一点我们可以看到Dr. Zdenek的论文从时间上来看是一个总-分-总的格局。从框架——跟踪器——PN学习——框架。那么我们可以从研究方法上来说需要做的是理清思路——然后寻找关键问题——解决关键问题——总结,从而形成一个完整的结构。记得李开复在他自传中说他导师和他讲过:“博士就是在一个狭窄的领域做出世界一流的研究”。从研究点来讲一个单目标的跟踪问题从问题本身来说不算大,但如Dr. Zdenek一样,这个领域从来不乏杰出的研究者和研究成果。这些天的对算法的学习又一次让有志于去读博作研究的我得到一点启发吧。

废话说了很多,其实也就是一个想法。如果我们有志于向牛人的方向努力,那在每次学习中,不应该只注重方法本身,更应该注重方法的作者是怎么发现它的,他是怎么思考的,又是怎么去探索出解决方案的。就如一句古话“授人以鱼不如授人以渔”,同样在学习中也是“学人以鱼不如学人以渔”。接下来的系列中,小硕期待总结一下学习所得,因此研究算法的牛人及其算法分析已然很多,故名为菜鸟看TLD系列。以期有朝一日也能学人以“渔”成为牛人。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值