深度学习实践——逻辑斯蒂回归

最新推荐文章于 2024-04-25 16:07:30 发布

原创

最新推荐文章于 2024-04-25 16:07:30 发布 · 256 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#回归 #深度学习 #机器学习

文章介绍了如何使用PyTorch框架解决分类问题，特别是针对二分类任务，通过逻辑斯蒂回归模型。内容包括模型构造、损失函数（BCE损失）以及训练过程。示例代码展示了如何构建和训练一个简单的LogisticRegressionModel，并利用sigmoid函数将连续输出转换为概率。

感谢学习视频：https://www.bilibili.com/video/BV1Y7411d7Ys?p=6&vd_source=2314316d319741d0a2bc13b4ca76fae6
本节考虑分类问题，建立模型是逻辑斯蒂回归，虽然名字叫回归，但处理分类问题的。

标题

在这里插入图片描述
这是之前用线性回归模型。

在这里我们估计的y是属于连续空间，像这种任务叫回归分析。
但机器学习中做的多的是分类问题。

MNIST是一个手写数字数据集，有10个类别，如果用回归方法做分类问题，比如说：第0个类别，就让y=0；第1个类别就让y=1，这种思想是不好的。因为这些0-9的类别没有一维实数空间数值大小的含义，即类别之间不是数值比较，即图片中的9没有比图片中的0抽象概念（类别）大。所以，分类问题不能用线性回归这种模型简单的输出0-9来做。
分类问题的核心是概率：根绝输入x，得到y输出为0的概率，输出为2的概率…。概率是满足一个分布的，概率之和为1，从概率值里找最大概率值。
在这里插入图片描述
MNIST是最基础的数据集，用来测量学习器的性能指标，所以在pytorch框架中有一个 torchvison 包，这个包里有一个模块提供相应的数据集，一些比较流行的数据集都有。但，安装torchvison时他不会把数据集包含在包里面，如果你没有下载该数据集，可用上面的程序自动下载。【少部分不支持自动下载】
参数1：数据集存储路径；参数2：train=True表示训练集，False表示测试集；参数3：download=True联网自动下载，False表示已下载了。
在这里插入图片描述
CIFAR数据集：32*32的图片，10个类别，
下载过程和参数设置与上面一致。

在这个数据集下，原来是回归问题，就是学习时间与他最后拿多少分？而在分类任务里，就是他最后是否通过考试？【过；不过，两个类别的分类问题 = 二分类问题】
二分类问题最终要计算的就是两个概率【实际计算一个即可，因为两者加和等于1】
如果计算出来的概率非常接近0.5，意味着我们的学习器对这个数据样本的类别并无十足把握。
在这里插入图片描述

之前用线性模型，y_hat=wx+b 输出为一个实数，而分类问题我们需要的是概率属于【0，1】，所以我们需要把实数映射到【0，1】，即找一个函数来实现： logistic 函数
可以观察到这个函数有个特点：超过某一阈值后，剩余一段增长的很慢，他的导数会变得越来越小。
这种函数数学中称之为饱和函数
logistic 函数的导数图像像正态分布的分布函数。【它就是因正态分布而产生的函数】
sigmoid Function

函数值有极限
单调增
饱和函数

这些函数是【-1，1】
在所有sigmoid函数中最出名的就是logistic 函数，所以，现在在一些框架中，直接把logistic 函数称为sigmoid 【约定俗称】。
模型的不同：

损失函数改变

loss原来用的是MSE，y_hat-y是有意义的，是数轴上两者的距离，目的是让这个距离最小化。而现在输出是分布分布不是数轴上的距离，实际表示的是
数据集的y有可能为0或1，

想比较的是两个分布之间的差异。计算分布的差异。
计算两个分布直接差异，在概率论中，比如：KL散度、cross-entropy【交叉熵】等。
交叉熵公式：

假如有两个分布，Pd和Pt

用这个公式来表示两个分布之间差异性的大小，越大越好。
在这里，我们用了一个二分类的交叉熵：

最低0.47元/天解锁文章