机器学习学习笔记（五）——分类

最新推荐文章于 2025-11-25 01:48:54 发布

原创最新推荐文章于 2025-11-25 01:48:54 发布 · 275 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习

机器学习专栏收录该内容

6 篇文章

订阅专栏

本文深入解析了二分类问题中Logistic回归的应用，介绍了假设函数、决策边界、代价函数及梯度下降等关键概念，探讨了如何通过Logistic函数进行分类预测。

二分类问题

在分类问题中，一般不使用线性回归进行分类，因为效果很差。

在二元分类问题上，我们使用logistic回归进行分类

假设函数

在logistic回归中，有logistic函数
$g(z)=\frac{1}{1+e^{-z}}$
假设函数为
$h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}$
假设函数 $hθ(x)h_\theta(x)$ 代表 $y = 1$ 的概率，则 $y = 0$ 的概率为 $1−hθ(x)1-h_\theta(x)$ 。

如果我们认为当 $hθ(x)>0.5h_\theta(x)>0.5$ 的时候，可以认为 $y = 1$ ;

且logistic函数有如下性质
$z\geq0,g(z)\geq0.5$
则我们可以认为如果 $ΘTX≥0\Theta^TX\geq0$ ，则 $y = 1$ ；如果 $ΘTX<0\Theta^TX<0$ ，则 $y = 0$ 。那么我们可以用线 $ΘTX=0\Theta^TX=0$ 将两类分离开，这条线称作决策边界。

代价函数

在今后我们统一将代价函数写为
$J(\Theta)=\frac{1}{m}\sum_{i=1}^{m}{cost(h_\Theta(x^{(i)}),y)}$
在logistic回归中由于平方误差函数不是凸函数，可能会落入局部最优解，我们使用如下的cost函数
$cost（h_\Theta(x),y)=\begin{cases} -log(h_\Theta(x))&y=1\\ -log(1-h_\Theta(x))&y=0\end{cases}$
则代价函数可以写为
$J(\Theta)=-\frac{1}{m}\sum_{i=1}^{m}{y^{(i)}log(h_\Theta(x^{(i)})+(1-y^{(i)})log(1-h_\Theta(x^{(i)}))}$

梯度下降

经过一些里骚操作推导得到梯度下降公式
$\theta_j:=\theta_j-\frac{\alpha}{m}\sum_{i=1}^{m}{(h_\Theta(x^{(i)})-y^{(i)})x^{(i)}_j}$
这里
$h_\Theta(x)=\frac{1}{1+e^{-\Theta^Tx}}$