LR的原理，损失函数，求解方法

最新推荐文章于 2022-09-26 16:06:53 发布

原创最新推荐文章于 2022-09-26 16:06:53 发布 · 703 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习

机器学习同时被 2 个专栏收录

6 篇文章

订阅专栏

人工智能

5 篇文章

订阅专栏

本文深入讲解逻辑回归原理，包括其如何通过逻辑函数将线性回归转换为二分类问题，详细解析损失函数及其求导过程，并介绍梯度上升法求解最优参数。

LR的原理，损失函数，求解方法_背诵版

LR的原理
损失函数
求解方法

LR的原理

逻辑回归本质上是线性回归，只是在特征到结果的映射中加入了一层逻辑函数， ${\rm{g}}(z) = \frac{1}{{1 + {e^{ - z}}}}$ ，即：先把特征线性求和 ${\rm{z}} = {w_0} + {w_1}*{x_1} + ..., + {w_n}*{x_n}$ ,然后使用函数g(z)作为假设函数来预测。
逻辑回归用来分类0/1问题，也就是预测结果属于0或者属于1的二值分类问题，有模型：
$g({w^T}x) = \frac{1}{{1 + {e^{ - {w^T}x}}}}$
$g({w^T}x) = \frac{{{e^{ - {w^T}x}}}}{{1 + {e^{ - {w^T}x}}}}$

损失函数

对于训练数据集，特征数据 $x = \{ {x_1},{x_2},...,{x_m}\}$ 和对应的分类标签 ${\rm{y}} = \{ {y_1},...,{y_m}\}$ 。假设m个样本相互独立，那么它们的联合分布为各边缘分布的乘积，得到似然函数：
${\prod\limits_{i = 1}^m {g({w^T}x)} ^{{y_i}}}*{(1 - g({w^T}x))^{1 - {y_i}}}$
取对数：
$\ln L(w) = \sum\limits_{i = 1}^m {{y_i}*\ln g({w^T}x)} + (1 - y)\ln (1 - g({w^T}x))$

求解方法

与线性回归类似，我们使用梯度上升的方法(类似与梯度下降方法)，那么随机梯度上升更新规则为： $\alpha *{\nabla _w}e(w)$

$\begin{array}{l} \frac{\partial }{{\partial {w_j}}}e(w) = \frac{\partial }{{\partial {w_j}}}\{ \sum\limits_{i = 1}^m {\{ {y_i}ln\;g({w^T}{x_i})} + (1 - {y_i})ln\;(1 - g({w^T}{x_i}))\} \\ \;\;\;\;\;\;\;\;\;\;\;\;\; = \frac{\partial }{{\partial {w_j}}}\sum\limits_{i = 1}^m {[\frac{{{y_i}}}{{g({w^T}{x_i})}} - \frac{{1 - {y_i}}}{{1 - g({w^T}{x_i})}}]g({w^T}{x_i})'} \\ \;\;\;\;\;\;\;\;\;\;\;\;\; = \frac{\partial }{{\partial {w_j}}}\sum\limits_{i = 1}^m {[{y_i} - g({w^T}{x_i})]({w^T}{x_i})'} \\ \;\;\;\;\;\;\;\;\;\;\;\;\; = \sum\limits_{i = 1}^m {[{y_i} - g({w^T}{x_i})]{w_j}} \end{array}$