理解逻辑回归：模型构建与损失函数-优快云博客

本文链接：https://blog.youkuaiyun.com/MaxxiChen/article/details/106228197

本文详细介绍了逻辑回归的基本概念，包括问题引入、模型建构、损失函数的定义和推导，以及参数更新的过程。逻辑回归是通过sigmoid函数将线性函数映射到[0,1]范围内，用于预测分类概率。损失函数采用了交叉熵，衡量预测与实际结果的差异。逻辑回归在实际应用中是线性回归的一种扩展，适用于二分类问题。" 108178654,9628239,腾讯笔试：解压缩字符串算法解析,"['java', '算法', '字符串处理']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题引入与模型建构

现有20个学生投入0-6个小时学习课程的记录，分析投入时间和是否通过考试的概率的关系。在这个问题中是否通过考试只有两种结果：通过和不通过。可以用虚拟变量1和0分别表示。我们用y代表已知的考试结果，x为已知的投入时间，发现其中还有一个隐藏变量：知识掌握程度，可以先设为z，假设z(x)线性变化，当然z(x)的具体表达式暂时未知，需要通过学习来获得。而对分类问题的预测其本质是建立在z(x)的基础上的。这一点很多文章并没有讲清楚，但对于算法的理解至关重要。
他们之间的关系是z(x)，y(z)。同时选用sigmoid 函数作为合理的y(z)的关系。
在这里插入图片描述

模型构建

在介绍Logistic Regression之前我们先简单说一下线性回归，线性回归的主要思想就是通过历史数据拟合出一条直线，用这条直线对新的数据进行预测，线性回归可以参考我之前的一篇文章。
这里直接给出公式(这里简短插一句，我觉得应该写成X^T*Theta的形式，因为Theta才是主变量):
$\begin{pmatrix} b&w \end{pmatrix} \begin{pmatrix} 1\\ x \end{pmatrix}=\Theta^TX\\ {}\\ Pr(y=1|X;\Theta)=y(z)=h_{\Theta}(z)=\frac{1}{1+e^{-z}}\\ {}\\ Pr(y=0|X;\Theta)=1-h_{\Theta}(z)$