正则化在机器学习中的应用-优快云博客

机器学习05：正则化

1 线性回归的正则化

1.1 损失函数

$J(\theta)=\frac{1}{2m}\left[\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})^2+\lambda\sum_{j=0}^n\theta_j^2 \right]$

1.2 梯度下降法

$R e p e a t :$
$\theta_0:=\theta_0-\alpha\frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})x_0^{(i)}\\ \begin{aligned}\theta_j&:=\theta_j-\alpha\left[\frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}-\frac{\lambda}{m}\theta_j\right]\\&:=\theta_j(1-\alpha\frac{\lambda}{m})-\alpha\frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}\end{aligned}$

1.3 正规方程法

$X=\begin{bmatrix}(x^{(1)})^T\\···\\ (x^{(m)})^T\end{bmatrix},\quad y=\begin{bmatrix}y^{(1)}\\···\\ y^{(m)}\end{bmatrix}$
解得：
$\theta=(X^TX+\lambda\begin{bmatrix} 0 & 0 & \cdots & 0\\ 0& 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1\end{bmatrix})^{-1}X^Ty$

1.4 矩阵不可逆问题的解决

正则化之后，线性回归中的不可逆问题将不存在。

2 Logistic 回归的正则化

2.1 损失函数

$J(\theta)=-\frac{1}{m}\left[\sum_{i=1}^my^{(i)}log\,h_\theta(x^{(i)})+(1-y^{(i)})log\,(1-h_\theta(x^{(i)}))\right]+\frac{\lambda}{2m}\sum_{j=1}^n\theta_j^2$

2.2 梯度下降

$R e p e a t :$
$\theta_0:=\theta_0-\alpha\frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})x_0^{(i)}\\\theta_j:=\theta_j-\alpha\left[\frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}-\frac{\lambda}{m}\theta_j\right]$
其中：
$h_\theta(x)=\frac{1}{1-e^{-\theta^Tx}}$