【转自cvchina】online random forest

最新推荐文章于 2019-09-05 18:00:48 发布

原创最新推荐文章于 2019-09-05 18:00:48 发布 · 3.2k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#random #object #idea #2010 #算法

这篇博客介绍了在线学习的概念，特别是针对数据量大或无法预先获取所有训练数据的情况。文章对比了批量模式学习的不足，并重点讨论了在线学习的挑战。提到了在线Adaboost在目标跟踪中的应用以及存在漂移问题，以及一篇关于在线随机森林的论文，该方法在效果上接近离线模式。推荐了两篇相关论文并提供了代码资源。

http://www.cvchina.info/2010/05/26/online-random-forest/

优秀网站：http://www.cvchina.info/tag/machine-learning/

2010年5月26日 CVUNC

一直忽悠cvchina，心有歉意。第一次发文，简单写点online learning的东西。

传统的SVM和adaboost都是batch mode learning. 所谓的batch mode learning，简单说，就是所有的训练数据都是available的（或则说所有训练数据都已经在内存中）。这种方法主要有2个缺点：

1）有时候数据量太大，在内存中放不下，处理起来不方便

2）由于应用环境限制，有时候无法在训练之前得到所有训练数据

而Online learning，他的数据是come in sequence，也就是说traning sample 是一个一个来，或则是几个几个来，然后classifer 根据新来的samples进行更新。Online learning是比较困难的，主要原因是你无法知道将来的训练数据是如何的。显然adaboost和svm是行不通的。最近几年也有一些人做online learning的研究，主要方法还是集中在online boosting这一块。推荐2篇不错的文章：

1） online adaboost [1], 并把他用在object tracking等方面。这篇文章发表于CVPR2006引用率蛮高。这几年的cvpr上的几篇做tracking的文章以这个idea为基础。tracking的方法是用最近比较流行的tracking-by-detection的方法。简答的说就是在tracking的时候，observation model这一块是用一个在线训练的分类器。tracking的过程如下图所示（图中还有一步是用跟踪的结果作为训练器的新的输入）：

这篇文章online 训练的时候，用tracking 的结果作为online classifier的positive samples。显然这种数据是有噪声的，最后tracking会drift掉。而且需要指出的是，这种方法没有严格证明，只是模仿batch mode adaboost. 我把这个算法用在uci的训练数据上，效果不是很好。作者的主页是：http://www.vision.ee.ethz.ch/~hegrabne/. 这个是他用online learning 做tracking的项目主页：http://www.vision.ee.ethz.ch/boostingTrackers/。有现成代码和demo。

2）去年的一篇论文是关于online random forest[2]。网上有现成的代码。我跑了一下，挺牛逼的，效果没比offline mode差不多。如果你需要做online learning的话十分推荐。

[1].On-line Boosting and Vision. 06CVPR.

[2]. Online random forest. 09ICCV workshop on online machine learning.

PS：code的原始链接失效了，我传了一份到mediafire。下载链接