自动数据库创建与目标模型学习
1. 引言
传统模型多为离线训练,且缺乏对已学样本的验证流程,也未尝试将生成样本作为训练数据自动采集以构建目标数据库。本文介绍一种基于在线提升学习的自主学习框架,无需初始或预训练,仅需在首个输入图像上选择一个优质正样本初始化跟踪器,后续无需用户交互。该框架利用在线提升学习进行学习和跟踪,可在线学习目标检测器并生成目标样本,还能利用跟踪信息选择最有价值的正负样本,更新现有分类器并将结果存储到目标数据库,简化了样本生成过程,减少了人工准备训练集的工作量,可实时处理来自摄像头或视频序列的图像。
2. 学习框架
2.1 在线学习
在线提升学习用于特征选择,其主要思想是每个特征 $f_j$ 对应一个弱分类器 $h_j$,提升算法会选择 $N$ 个信息丰富的特征子集,弱分类器的性能只需略优于随机猜测(即二分类任务的错误率小于 50%)。本文使用类 Haar 特征,可通过积分数据结构高效计算。
-
离线特征选择提升算法 :
- 给定正负样本训练集 $\chi = { (x_1, y_1), \cdots, (x_L, y_L) }$,其中 $x_i \in \mathbb{R}^m$ 是样本,$y_i \in { -1, +1 }$ 是对应标签。
- 一组可能的特征 $F = { f_1, \cdots, f_M }$,学习算法 $\Im$ 和均匀初始化的权重分布 $D(i) = \frac{1}{L}$。
- 在每次迭代 $n$($n = 1, \cdots, N$)中,评估