基于AdaBoost级联分类器的人脸/眼睛位置检测算法概述

AdaBoost分类器概述

—— 才疏学浅, 难免有错误和遗漏, 欢迎补充和勘误.

AdaBoost算法在1995年由Freund和Shapired提出,它是机器学习领域中一种重要的特征分类方法，其可以训练一系列的弱分类器 $G_k(x)$ 来获得最终的一个强分类器 $F (x)$ 。但是因为其计算量太大，所以迟迟未能应用在人脸检测领域。直到2001年Jones与Viola两位教授把Haar-like特征以及积分图的概念引入到Adaboost中，才将用Haar级联分类器来检测人脸的方法推入了历史舞台。
下面以二分类人脸检测为例通过把 $m$ 个样本数据 $T$ 通过 $k$ 个弱分类器 $G_k(x)$ 训练成强分类器 $F (x)$ 的过程对Adaboost迭代算法进行概述, $k$ 为进行到第 $m$ 轮的弱分类器训练， $G_k(x)$ 为第 $k$ 个弱分类器：

在这里插入图片描述

图1. AdaBoost分类器的训练过程图

假定有 $m$ 个样本构成一个样本集合 $T$ ：
$\left\{ {\left( {x_1,y_1} \right),\left( {x_2,y_2} \right),...,\left( {x_i,y_i} \right),{\rm{ }}...{\rm{ }},\left( {x_m,y_m} \right)} \right\}{\rm{ }};i = 1,2...m$
其中 $x_i$ 为样本的描述， $y_i \in (1, - 1)$ 为样本的标识。在人脸检测中 $x_i$ 可以是每张图片的序号，该图片为正样本时 $y_i = 1$ 时，即为人脸图像；该图片为负样本时 $y_i = -1$ ，即为非人脸图像。下面对该样本进行分类训练：

在第一轮训练中样本的权重系数分布 $D (1)$ 都设置为 $\frac{1}{m}$ ，其中 $\omega _{ki}$ 代表第 $k$ 轮第 $i$ 个样本的权重。
$\left\{ {\omega _{11},\omega _{12},...\omega _{1m}} \right\};\omega _{1i} = \frac{1}{m};i = 1,2...m$
在第一轮中把每一个样本点的权重都初始化为 $\frac{1}{m}$ ，这样能够保证在训练第一个弱分类器 $G 1 (x)$ 时每个样本点起的作用是一样的。

遍历样本集中 $x$ 的阈值分界点 $v$ ，对于每一个弱分类器 $G_k(x)$ ，计算该轮分类的误差率 $e_k$ ，选取使样本序号 $x$ 在以 $v$ 为分界点时分类误差率 $e_k$ 最低时的阈值 $v$ ,并最终确定该轮下的弱分类器：
$G_{k}(x)= \begin{cases}1 & p_{i} x<p_{i} v \\ 0 & \text { otherwise }\end{cases}$
弱分类器 $G_k(x)$ 的值为1说明该图片是人脸图像，值为0时说明该图片是非人脸图像; $p_i$ 的作用是确定不等号的方向。分类误差率计算公式为： $e_k = P(G_k(x_i) \ne y_i) = \sum\limits_{i = 1}^m {\omega _{ki}I} (G_k(x_i) \ne y_i)$
其中 $I\left(G_{k}\left(x_{i}\right) \neq y_{i}\right)= \begin{cases}1 & G_{k}\left(x_{i}\right) \neq y_{i} \\ 0 & G_{k}\left(x_{i}\right)=y_{i}\end{cases}$ ，即让第 $k$ 轮第 $i$ 个样本的权重 $\omega_{ki}$ 乘以0或1再求和，其中当分类器的判断是正确时( $G_k(x_i) = y_i$ )为0,错误时( $G_k(x_i) \ne y_i$ )为1。即经此计算后可以得到该轮分类的误差。

因为Adaboost是加法模型、前向分步学习算法,又通过对Adaboost算法中指数型的损失函数进行优化，对损失函数Loss求偏导( $\frac{{\partial Loss}}{{\partial \alpha }}$ )令其等于0,计算出 $\alpha _k$ 和 $e_k$ 的关系： $\alpha _k = \frac{1}{2}\log \frac{{1 - e_k}}{{e_k}}$
经此计算后，达到分类误差 $e_k$ 越高的弱分类器 $G_k(x)$ 其权重系数 $\alpha _k$ 越小的目的，这样可以提高检测准确率。

更新下一轮每个样本点的权重系数： $\omega _{k + 1,i} = \frac{{\omega _{ki}}}{{Z_k}}\exp ( - \alpha _ky_iG_k(x_i))$

其中 $Z_k$ 是规范化因子， $Z_{k}=\sum_{i=1}^{m} \omega_{k i} \exp \left(-\alpha_{k} y_{i} G_{k}\left(x_{i}\right)\right)$ ，作用是将样本权重归一化。如果某个样本被错误分类，会导致 $y_iG_k(x_i) < 0$ ，导致在下一轮的分类中权重 $\omega$ 变大进而影响样本描述 $x$ 的分类阈值 $v$ ，从而达到了更重视错误样本分类工作的目的。
经过该计算后得到了该轮所有的样本权重：
$D(k+1)=\{\omega_{(k+1) 1}, \omega_{(k+1) 2}, \ldots \omega_{(k+1) m}\} ; \sum_{1}^{m} \omega_{(k+1) i}=1$
再去重复步骤2.-4.，直至所有的弱分类器训练完毕。

Adaboost生成最终强分类器采用的方法是弱分类器的加权求和法，将每一级弱分类器乘以一个权重后再相加形成最终的强分类器：
$F(x)=\operatorname{sign}\left(\sum_{\mathrm{k}=1}^{K} \alpha_{k} G_{k}(x)\right)=\left\{\begin{array}{cl}1 & \sum_{\mathrm{k}=1}^{K} \alpha_{k} G_{k}(x)>0 \\ 0 & \sum_{\mathrm{k}=1}^{K} \alpha_{k} G_{k}(x)=0 \\ -1 & \sum_{\mathrm{k}=1}^{K} \alpha_{k} G_{k}(x)<0\end{array}\right.$
其中 $K$ 为弱学习器的迭代次数， $F (x) = 1$ 代表通过， $F (x) = - 1$ 代表不通过， $F (x) = 0$ 代表不操作。至此，一个由一系列弱分类器通过训练而获得的强分类器形成了。