机器学习从零开始系列【第四话】分类问题_机器学习中positive classes-优快云博客

本文链接：https://blog.youkuaiyun.com/rizero/article/details/104142086

二分类问题

我们所说的逻辑回归问题实际上是分类问题的一种，并不是回归问题，这是历史遗留原因
$y\in$ {0,1}
Negative class 和Positive class
为什么线性分类器在分类问题表现不好？
在这里插入图片描述

引入逻辑回归模型

我们需要满足：
$\leq h(\theta)\leq1$
而我们之前设置的回归假设函数： $Z=\theta X$
引入一个特别的函数模型：Sigmoid 函数模型： $G(z)=\frac{1}{1+e^{-z}}$
图像：
sigmoid
这样就能满足 $\leq h(\theta)\leq1$ 了。

分类问题的损失函数

由于我们所使用的Sigmoid函数是非线性函数，假如使用我们之前的那个损失函数会导致出现多个局部谷点，难以收敛，我们必须为其重新设计一个。根据统计学的极大似然统计得到有一个函数
$Cost(h_\theta(x),y)=-ylog(h_\theta(x))-(1-y)log(1-h_\theta(x))$
因为我们的 y 只有两种值，要不就是0 和 1。
实际上这个函数可以分为：
$Cost(h_\theta(x),y)= \begin{cases} -log(h_\theta(x)) & \text{if } y=1 \\ -log(1-h_\theta(x)) & \text{if } y=0 \end{cases}$
示例：当 y=1 的图像 $Cost(h_\theta(x),y)=-log(h_\theta(x))$
Cost
一旦误判足够严重，惩罚会非常大。 $h_\theta(x)\rightarrow0,Cost\rightarrow+\infty$