UFLDL学习笔记2——Logistic Regression

最新推荐文章于 2022-11-05 18:50:19 发布

原创最新推荐文章于 2022-11-05 18:50:19 发布 · 671 阅读

0 ·

CC 4.0 BY-SA版权

ML 专栏收录该内容

5 篇文章

订阅专栏

本文深入探讨了Logistic Regression的工作原理及其在二分类问题中的应用。通过sigmoid函数将线性回归模型转换为概率预测模型，并详细介绍了损失函数（即交叉熵误差函数）的定义及其推导过程。此外，还涉及了梯度验证方法以及MATLAB中的向量化操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Logistic Regression

和前一节linear regression类似，只是logistic regression用于二分类问题，借助于sigmoid函数 $\sigma(x)=\frac{1}{1+e^{-x}}$ 的良好性质，使得可以从概率的角度去考虑二分类问题。判别函数定义为 $P(y=1|x)=h_{\theta}(x)=\frac{1}{1+e^{-\theta^\mathrm{T} x}}$ , $P(y=0|x)=1-h_\theta(x)$ .cost function定义为

J (θ) = - \sum i (y (i) l o g (h θ (x)) + (1 - y (i)) l o g (1 - h θ (x)))

$J(\theta)=-\sum_{i}(y^{(i)}log(h_\theta(x))+(1-y^{(i)})log(1-h_\theta(x)))$ .
又称为cross-entropy error function.这个可由似然函数

P(y|θ)=∏i=1mhθ(x(i))y(i)(1−hθ(x(i)))1−y(i) $P(y|\theta)=\prod\limits_{i=1}^{m}h_{\theta}(x^{(i)})^{y^{(i)}}(1-h_{\theta}(x^{(i)}))^{1-y^{(i)}}$ 取负的对数值得到。与linear regression相比，虽然判别函数和cost function在具体形式上不一样，但是导数在形式上是一样的。我的古董电脑执行不了 ex1b_logreg.m，提示out of memory。。。这里也提到了这个问题，但按照他说的方法试了试还是不行，换了一台稍微给力点的电脑就可以执行了。

Vectorization

这节主要是让我们感受下MATLAB的vectorization features，上节已经搞过。

Debugging：Gradient Checking

这节主要是验证自己写的梯度计算函数是否正确，利用

g (θ) \approx J ( θ + E P S I L O N ) - J ( θ - E P S I L O N ) 2 * E P S I L O N

$g(\theta)\approx\frac{J(\theta+EPSILON)-J(\theta-EPSILON)}{2*EPSILON}$
看了下他们写的 grad_check.m,看别人码的代码也能学不少东西。这个函数参数列表里用了 MATLAB里面的 varargin：Variable length input argument list。大致就是可以实现参数个数的动态化，不必事先指定函数需要传进多少个参数。