二分类:0/1
二元交叉熵损失:衡量模型的预测概率与真实标签之间的差异,模型输出的概率分布与目标分布之间的差异。
设n个样本,y为真实标签(0/1)
p模型的预测概率,激活函数挤压,p值范围:【0,1】
yi:真实标签
pi:预测概率
交叉熵损失(BCELoss)的公式中前面有一个负号,是为了将 最大化对数似然 转换为 最小化负对数似然,以适应梯度下降等最小化损失的优化算法
'分类问题:逻辑斯蒂回归'
'输出属于每一个分类的概率值,找最大值'
'torchvison:提供比较热门常见数据集'
'''
CIFAR一些图片数据集
'''
'''
概率,(0,1)之间,sigmoid函数把实数挤压。饱和函数。正态分布
损失函数改变,输出为分布
二分类:交叉熵
分布差异,ln
两个分布之间差异性的大小
BCE Loss
'''
import torch.nn.functional as F
x_data=torch.Tensor([[1.0],[2.0],[3.0]])
'y_data=torch.Tensor([[2.0],[4.0],[6.0]])'
'目标输出(标签),形状为 (3, 1),目标值为二进制标签,表示两个类别。值为 0, 0, 1,表示前两个样本属于类别 0,最后一个样本属于类别 1'
y_data = torch.Tensor([[0],[0],[1]])
class LogisticRegressionModel(torch.nn.Module):
def __init__(self):
super(LogisticRegressionModel,self).__init__()
self.linear = torch.nn.Linear(1,1)
def forward(self,x):
y_pred=F.sigmoid(self.linear(x))
return y_pred
model=LogisticRegressionModel()
'计算模型预测的概率和实际标签之间的误差'
criterion = torch.nn.BCELoss(size_average=False)
optimizer = torch.optim.SGD(model.parameters(),lr=0.01)
for epoch in range(1000):
y_pred=model(x_data)
loss=criterion(y_pred,y_data)
print(epoch,loss.item())
optimizer.zero_grad()
loss.backward()
optimizer.step()
import numpy as np
import matplotlib.pyplot as plt
'生成 200 个均匀分布在 [0, 10] 之间的点,作为测试数据'
x=np.linspace(0,10,200)
'将 x 转换为 PyTorch 张量,并调整形状为 (200, 1),以便输入到模型中'
x_t = torch.Tensor(x).view((200,1))
y_t = model(x_t)
y = y_t.data.numpy()
plt.plot(x,y)
plt.plot([0,10],[0.5,0.5],c='r')
plt.xlabel('Hours')
plt.ylabel('Probability of Pass')
plt.grid()
plt.show()