从一个简单的数据集学习Logistic Regression

最新推荐文章于 2023-12-20 17:38:05 发布

coding丁

最新推荐文章于 2023-12-20 17:38:05 发布

阅读量773

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签： Logistic Regression

本文链接：https://blog.youkuaiyun.com/dingdingdodo/article/details/101163249

本文深入探讨了Logistic Regression的原理和应用，包括Sigmoid函数的特性、模型的优化目标——极大似然估计，以及如何通过梯度下降法求解损失函数的最小值。通过代码示例展示了Logistic Regression模型的训练过程，并提供了训练和测试数据集的链接。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Logistic Regression

Logistic Regression是一种被广泛使用的分类算法，通过训练数据中的正负样本，学习样本特征到样本标签之间的假设函数。

通常用于将数据映射到不同类别的函数成为阈值函数，常用的阈值函数为Sigmoid函数，形式为：
$f(x)=\frac{1}{1+e^{-x}}$
Sigmoid函数的图像：

在这里插入图片描述
从Sigmoid的图像可以看出函数的值域为(0,1),在0附近变化比较明显

Sigmoid函数的python代码：

def sig(x):
    '''Sigmoid函数
    input:  x(mat):feature * w
    output: sigmoid(x)(mat):Sigmoid值
    '''
    return 1.0 / (1 + np.exp(-x))

因此对于输入向量X，其属于正例和反例的概率为：
$P(y=1|X,W,b)=\frac{1}{1+e^{-（WX+b）}}\\反例的概率： P(y=1|X,W,b)=\frac{e^{-(WX+b)}}{1+e^{-（WX+b）}}$
对于Logistic Regression算法来说，如何定义W和b使得算法最优？(什么是最优)