machine learning个人笔记系列 (三)

最新推荐文章于 2025-01-31 06:15:00 发布

原创最新推荐文章于 2025-01-31 06:15:00 发布 · 177 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

ml 专栏收录该内容

7 篇文章

订阅专栏

本文深入解析逻辑回归算法，从背景到模型构建，详细介绍了信号函数及其应用，损益函数的定义与计算，以及如何通过梯度下降法优化模型参数。同时，文章探讨了高级优化算法的应用及多分类问题的解决方案。

逻辑回归（分类算法）

向Andrew Ng的机器学习课程致敬

逻辑回归（分类算法）

背景

邮件中有垃圾邮件和正常邮件，如何过分辨垃圾邮件和正常邮件，从而过滤掉垃圾邮件。将正常与非正常分别用0，1来表示，则需要预测值为{0，1}这个集合中。

模型

模型公式为：

h θ (x) = 1 1 + e - θ T x

$h_{\theta}(x) = \frac{1}{1 + e^{-\theta^{T}x}}$

这其实是一个信号函数，模型的曲线为下图的右下角：
这里写图片描述

$h_{\theta}(x)$ 表示给定x的值后该模型上 $y=1$ 的概率
$0 <= h_{\theta}(x) <= 1$ ，然后设定一个阈值，比如0.5，则高于0.5认为是1，低于0.5是0。这样就可以达到分类的效果。

我们拆分模型来看，其实是两个公式拼凑到一块：

h θ (x) = g (θ T x) g (z) = 1 1 + e - z

$h_{\theta}(x) = g(\theta^{T}x) \\ g(z) = \frac{1}{1+e^{-z}}$

如果 $h_{\theta}(x) >= 0.5$ 意味着 $\theta^{T}x >= 0$

损益函数

函数

如果模型预测值与真实值一致，那模型就非常完美了。为了计算模型与真实值的差距，根据差距大小以此来选择合适的模型参数，让模型最接近真实值是模型的优化方向。为此定义如下损益函数来计算逻辑回归模型的预测值与真实值的差距：

C o s t (h θ (x), y) = {- l o g (h θ (x)) ， i f y = 1 - l o g (1 - h θ (x), i f y = 0

$Cost(h_{\theta}(x), y) = \left\{ \begin{aligned} -log(h_{\theta(x)})，if y = 1 \\ -log(1 -h_{\theta}(x), if y = 0 \end{aligned} \right.$

如下面两图左下角所示，上面是当 $y=1$ 时的曲线图，下面是 $y=0$ 时的曲线图。

这里写图片描述

梯度下降法优化模型

为了更适合用梯度下降算法求解参数，转化一下损益函数为下面格式：

J (θ) = 1 m \sum i = 1 m C o s t (h θ (x (i)), y (i)) = - 1 m [\sum i = 1 m y (i) l o g h θ (x (i)) + (1 - y (i)) l o g (1 - h θ) (x (i))]

$J(\theta) = \frac {1}{m} \sum_{i=1}^{m}Cost(h_{\theta}(x^{(i)}), y^{(i)}) \ = -\frac {1}{m} [\sum_{i=1}^{m} y^{(i)}logh_{\theta}(x^{(i)}) + (1-y^{(i)})log(1-h_{\theta})(x^{(i)})]$

每次迭代更新参数方式为：

θ j : = θ j - α \sum i = 1 m (h θ (x (i)) - y (i)) x (i) j

$\theta_j :=\theta_j - \alpha\sum_{i=1}^{m}(h_{\theta}(x^{(i)}) - y^{(i)})x_j^{(i)}$

高级优化算法

Conjugate gradient
BFGS
L-BFGS
这些算法不用选学习率，并且更快，但是比较复杂。暂时不介绍这些算法，于我们理解模型没有什么太大用处。

多分类

多分类问题是二分类的一个扩展，如下图所示，一个数据集里有三种类型数据，如何区分？
直观的想法是，将其转换为二分类问题，属于某一类和不属于某一类，这样分多次就形成了多分类模型。
这里写图片描述

具体的做法就是：
1. 为每一类 $i$ 数据训练一个模型 $h_{\theta}^{(i)}(x)$
2. 对每个数据都使用所有模型求出预测值，将该数据分类为模型值最大的那个分类，即 $Max \ h_{\theta}^{(i)}(x)$

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。