逻辑斯蒂回归分类问题-优快云博客

本文链接：https://blog.youkuaiyun.com/m0_53850135/article/details/142695146

二分类：0/1

二元交叉熵损失：衡量模型的预测概率与真实标签之间的差异，模型输出的概率分布与目标分布之间的差异。

设n个样本，y为真实标签（0/1）

p模型的预测概率，激活函数挤压，p值范围：【0，1】

$BCELoss(y,p)=-\frac{1}{n}\sum_{i=1}^{n}\left [ y_{i} \log (p_{i})+(1-y_{i})\log (1-p_{i})\right ]$

yi:真实标签

pi:预测概率

交叉熵损失（BCELoss）的公式中前面有一个负号，是为了将 最大化对数似然 转换为 最小化负对数似然，以适应梯度下降等最小化损失的优化算法

'分类问题：逻辑斯蒂回归'
'输出属于每一个分类的概率值，找最大值'
'torchvison：提供比较热门常见数据集'
'''
CIFAR一些图片数据集
'''
'''
概率，（0，1）之间，sigmoid函数把实数挤压。饱和函数。正态分布

损失函数改变，输出为分布
二分类：交叉熵
分布差异，ln
两个分布之间差异性的大小

BCE Loss
'''
import torch.nn.functional as F

x_data=torch.Tensor([[1.0],[2.0],[3.0]])
'y_data=torch.Tensor([[2.0],[4.0],[6.0]])'
'目标输出（标签），形状为 (3, 1)，目标值为二进制标签，表示两个类别。值为 0, 0, 1，表示前两个样本属于类别 0，最后一个样本属于类别 1'
y_data = torch.Tensor([[0],[0],[1]])


class LogisticRegressionModel(torch.nn.Module):
    def __init__(self):
        super(LogisticRegressionModel,self).__init__()
        self.linear = torch.nn.Linear(1,1)
        
    def forward(self,x):
        y_pred=F.sigmoid(self.linear(x))
        return y_pred
    
model=LogisticRegressionModel()

'计算模型预测的概率和实际标签之间的误差'
criterion = torch.nn.BCELoss(size_average=False)
optimizer = torch.optim.SGD(model.parameters(),lr=0.01)

for epoch in range(1000):
    y_pred=model(x_data)
    loss=criterion(y_pred,y_data)
    print(epoch,loss.item())
    
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
import numpy as np
import matplotlib.pyplot as plt

'生成 200 个均匀分布在 [0, 10] 之间的点，作为测试数据'
x=np.linspace(0,10,200)
'将 x 转换为 PyTorch 张量，并调整形状为 (200, 1)，以便输入到模型中'
x_t = torch.Tensor(x).view((200,1))
y_t = model(x_t)
y = y_t.data.numpy()
plt.plot(x,y)
plt.plot([0,10],[0.5,0.5],c='r')
plt.xlabel('Hours')
plt.ylabel('Probability of Pass')
plt.grid()
plt.show()