机器学习——逻辑回归（Logistic Regression）

最新推荐文章于 2024-09-10 14:26:22 发布

好的收到OK

最新推荐文章于 2024-09-10 14:26:22 发布

阅读量861

点赞数 26

分类专栏：机器学习文章标签：机器学习逻辑回归人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_74340055/article/details/139198317

版权

逻辑回归

一、理论

逻辑回归（Logistic Regression) 是一种广义的线性回归分析模型，它利用逻辑函数（通常是Sigmoid函数）将线性回归的输出值映射到0和1之间，从而用于处理二分类问题。

1.1 线性回归

1.1.1 线性回归的原理

线性回归是一种利用数理统计中回归分析的方法，来确定两种或两种以上变量间相互依赖的定量关系。其原理是假设因变量 $\ Y$ 与自变量 $\ X$ 之间存在线性关系，即 $\ Y$ 可以表示为 $\ X$ 的线性组合加上一个常数项。

1.1.2 线性回归的数学推导

1.1.2.1 模型设定

线性回归模型可以表示为：

$Y = w_1X_1 + w_2X_2 + ... + w_nX_n + b$

其中:

$\ Y$ 是因变量；
$X_1, X_2, ..., X_n$ 是自变量
$w_1, w_2, ..., w_n$ 是回归系数
$\ b$ 是截距项

为了简化表示，我们可以引入一个额外的特征 $X_0=1$ ，并将截距项 $\ b$ 视为 $w_0$ ，这样模型就可以表示为：

$Y = w_0X_0 + w_1X_1 + w_2X_2 + ... + w_nX_n$

进一步地，我们可以将上式写为矩阵形式：

$\ Y = \mathbf{w}^T\mathbf{X}$

其中:

$\ \mathbf{w} = [w_0, w_1, w_2, ..., w_n]^T$
$\ \mathbf{X} = [X_0, X_1, X_2, ..., X_n]^T$

1.1.2.2 求解参数 $\ \mathbf{w}$

从上述公式可以看出，线性回归模型的参数 $\ \mathbf{w}$ 是我们要求解的，为了实现这个目标，我们进行以下操作。

1.1.2.2.1 损失函数

在线性回归中，我们通常使用均方误差（Mean Squared Error, MSE）作为损失函数，以衡量模型预测值与实际值之间的差异。损失函数的数学表达式为：

$\ J(\mathbf{w}) = \frac{1}{2m}\sum_{i=1}^{m}(y^{(i)} - \mathbf{w}^T\mathbf{x}^{(i)})^2$

其中:

$\ m$ 是样本数量
$y^{(i)}$ 是第 $\ i$ 个样本的实际值
$\ \mathbf{x}^{(i)}$ 是第 $\ i$ 个样本的特征向量。

1.1.2.2.2 优化算法

很显然，为了使模型能够契合某一个数据集，我们要使损失函数的值越小越好，而为了找到使损失函数最小的参数 $\ \mathbf{w}$ ，我们通常采用梯度下降法（Gradient Descent） 进行求解。此外还有很多其它的优化算法，这边再介绍一个牛顿法（Newton’s Method）。

梯度下降法（Gradient Descent）

首先，我们需要计算损失函数 $\ J(\mathbf{w})$ 关于参数 $\ \mathbf{w}$ 的梯度。

对于参数 $\ \mathbf{w}$ 的第 $\ j$ 个分量 $w_j$ ，其梯度为：

$\ \frac{\partial J(\mathbf{w})}{\partial w_j} = \frac{1}{m}\sum_{i=1}^{m}(h_{\mathbf{w}}(x^{(i)}) - y^{(i)}) \cdot \frac{\partial}{\partial w_j}(\mathbf{w}^T\mathbf{x}^{(i)})$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。