本文转自http://blog.youkuaiyun.com/zwlq1314521/article/details/8140974
之所以从TLD这个算法开始扒,是因为它够经典,涉及的范围够广,引用的参考文献也够经典,哈哈,原作者已经在筹备开公司了。我刚开始学习就是从它入手,逐渐的扩展,写下来,给初学的人一点点参考。
TLD的代码是开源的,你可以从摄像头或者测试视频中选择任意的物体进行跟踪,所以tld和其他用分类器做的算法相比,是可以具体到某物,拿hog+svm,和ism来说吧,这两个算法都是具体到某一类别,比如行人啊,车辆啊,这主要是基于分类器做的检测在训练的时候要选择训练样本和样本标记,也就是属于有监督学习的过程。当然,你可以在线学习也就是半监督的形式,但是这对分类器的实时性要求很高,在《Incremental Learning for Robust Visual Tracking》中就y用的是在线学习,但是我仿真过,效率确实还不是满足不了实时场合的应用。而TLd也用到了在线学习,那么它之所以效率高些是因为它用的是random forest classifer,这是一个很好的分类器,也是近年来比较热门的,我所认识的cv领域的外国专家有限,但是他们对这个rf都用的很多。tld还有一个创新的地方就是P-N learning,那么再来就是他边检测边跟踪的了。也许你还不清楚,没关系,一步一步来看,先来一下总体的:看下面这个图:
