用pytorch 实现逻辑回归

本文详细介绍使用PyTorch构建逻辑回归模型的过程,包括数据集构造、模型搭建、损失函数定义、优化器设置及训练过程。通过10000次迭代训练,模型最终达到100%的分类准确率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用pytorch 实现逻辑回归

  • 构造数据集:
n_data = torch.ones(100, 2)
x0 = torch.normal(2 * n_data, 1)  # 生成均值为2.标准差为1的随机数组成的矩阵 shape=(100, 2)
y0 = torch.zeros(100)
x1 = torch.normal(-2 * n_data, 1)  # 生成均值为-2.标准差为1的随机数组成的矩阵 shape=(100, 2)
y1 = torch.ones(100)

#合并数据x,y
x=torch.cat((x0,x1),0).type(torch.FloatTensor)
y=torch.cat((y0,y1),0).type(torch.FloatTensor)
  • 根据构造的数据集显示图像
    在这里插入图片描述
    从图中看到,数据集区分比较明显。
  • 构建逻辑回归的网络
class LogisticRegression(nn.Module):
    def __init__(self):
        super(LogisticRegression,self).__init__()
        self.lr=nn.Linear(2,1)   #相当于通过线性变换y=x*T(A)+b可以得到对应的各个系数
        self.sm=nn.Sigmoid()   #相当于通过激活函数的变换

    def forward(self, x):
        x=self.lr(x)
        x=self.sm(x)
        return x
  • 定义损失函数和优化器
criterion=nn.BCELoss()   #选用BCE损失函数,该损失函数是只用于2分类问题的损失函数
optimizer=torch.optim.SGD(logistic_model.parameters(),lr=1e-3,momentum=0.9)  #采用随机梯度下降的方法
  • 开始训练
#开始训练
#训练10000次
for epoch in range(10000):
    if torch.cuda.is_available():
        x_data=Variable(x).cuda()
        y_data=Variable(y).cuda()
    else:
        x_data=Variable(x)
        y_data=Variable(y)

    out=logistic_model(x_data)  #根据逻辑回归模型拟合出的y值

    loss=criterion(out,y_data)  #计算损失函数
    print_loss=loss.data.item()  #得出损失函数值
    mask=out.ge(0.5).float()  #以0.5为阈值进行分类
    correct=(mask==y_data).sum()  #计算正确预测的样本个数
    acc=correct.item()/x_data.size(0)  #计算精度
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    #每隔20轮打印一下当前的误差和精度
    if (epoch+1)%20==0:
        print('*'*10)
        print('epoch {}'.format(epoch+1))  #误差
        print('loss is {:.4f}'.format(print_loss))
        print('acc is {:.4f}'.format(acc))  #精度
  • 输出结果
**********
epoch 9980
loss is 0.0179
acc is 100.0000
**********
epoch 10000
loss is 0.0179
acc is 100.0000
  • 输出结果的图像
    在这里插入图片描述
    从图中看到分类还是比较明显
  • 完整代码
import torch
import matplotlib.pyplot as plt
import torch.nn as nn
from torch.autograd import Variable
import numpy as np


n_data = torch.ones(100, 2)
x0 = torch.normal(2 * n_data, 1)  # 生成均值为2.标准差为1的随机数组成的矩阵 shape=(100, 2)
y0 = torch.zeros(100)
x1 = torch.normal(-2 * n_data, 1)  # 生成均值为-2.标准差为1的随机数组成的矩阵 shape=(100, 2)
y1 = torch.ones(100)

#合并数据x,y
x=torch.cat((x0,x1),0).type(torch.FloatTensor)
y=torch.cat((y0,y1),0).type(torch.FloatTensor)

print(x.data.numpy()[:,0])
#画图
# plt.scatter(x.data.numpy()[:,0],x.data.numpy()[:,1],c=y.data.numpy(),s=100,lw=0,cmap='RdYlGn')
# plt.show()

class LogisticRegression(nn.Module):
    def __init__(self):
        super(LogisticRegression,self).__init__()
        self.lr=nn.Linear(2,1)   #相当于通过线性变换y=x*T(A)+b可以得到对应的各个系数
        self.sm=nn.Sigmoid()   #相当于通过激活函数的变换

    def forward(self, x):
        x=self.lr(x)
        x=self.sm(x)
        return x

logistic_model=LogisticRegression()
if torch.cuda.is_available():
    logistic_model.cuda()


#定义损失函数和优化器
criterion=nn.BCELoss()   #选用BCE损失函数,该损失函数是只用于2分类问题的损失函数
optimizer=torch.optim.SGD(logistic_model.parameters(),lr=1e-3,momentum=0.9)  #采用随机梯度下降的方法

#开始训练
#训练10000次
for epoch in range(10000):
    if torch.cuda.is_available():
        x_data=Variable(x).cuda()
        y_data=Variable(y).cuda()
    else:
        x_data=Variable(x)
        y_data=Variable(y)

    out=logistic_model(x_data)  #根据逻辑回归模型拟合出的y值

    loss=criterion(out,y_data)  #计算损失函数
    print_loss=loss.data.item()  #得出损失函数值
    mask=out.ge(0.5).float()  #以0.5为阈值进行分类
    correct=(mask==y_data).sum()  #计算正确预测的样本个数
    acc=correct.item()/x_data.size(0)  #计算精度
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    #每隔20轮打印一下当前的误差和精度
    if (epoch+1)%20==0:
        print('*'*10)
        print('epoch {}'.format(epoch+1))  #误差
        print('loss is {:.4f}'.format(print_loss))
        print('acc is {:.4f}'.format(acc))  #精度


# 结果可视化
w0,w1=logistic_model.lr.weight[0]
w0=float(w0.item())
w1=float(w1.item())
b=float(logistic_model.lr.bias.item())
plot_x=np.arange(-7,7,0.1)
plot_y=(-w0*plot_x-b)/w1
plt.scatter(x.data.numpy()[:,0],x.data.numpy()[:,1],c=y.data.numpy(),s=100,lw=0,cmap='RdYlGn')
plt.plot(plot_x,plot_y)
plt.show()
### 使用 PyTorch 实现逻辑回归 为了实现一个可扩展的逻辑回归模型,可以利用 `PyTorch` 和其高级库如 `PyTorch Lightning Bolts` 来简化训练流程并提高效率[^1]。下面提供了一个简单的例子来展示如何构建和训练一个逻辑回归模型。 #### 导入必要的包 首先导入所需的 Python 库: ```python import torch from torch import nn, optim from torchvision.datasets import MNIST from torchvision.transforms import ToTensor from torch.utils.data import DataLoader ``` #### 定义数据加载器 定义用于获取训练集和测试集的数据加载器: ```python train_dataset = MNIST(root='./data', train=True, transform=ToTensor(), download=True) test_dataset = MNIST(root='./data', train=False, transform=ToTensor()) train_loader = DataLoader(dataset=train_dataset, batch_size=64, shuffle=True) test_loader = DataLoader(dataset=test_dataset, batch_size=64, shuffle=False) ``` #### 创建逻辑回归模型类 创建继承自 `nn.Module` 的逻辑回归模型类,并初始化线性层参数: ```python class LogisticRegression(nn.Module): def __init__(self, input_dim, output_dim): super(LogisticRegression, self).__init__() self.linear = nn.Linear(input_dim, output_dim) def forward(self, x): outputs = torch.sigmoid(self.linear(x)) return outputs ``` 注意,在这个版本中,权重和偏置不再作为单独属性存在;而是被封装在线性模块内部。可以通过调用 `.parameters()` 方法访问这些参数[^3]。 #### 设置损失函数与优化器 指定交叉熵作为损失函数以及 Adam 作为优化算法: ```python criterion = nn.BCELoss() optimizer = optim.Adam(model.parameters(), lr=0.001) ``` #### 训练过程 编写循环来进行多次迭代以完成整个训练周期内的前向传播、计算误差、反向传播更新权重操作: ```python num_epochs = 5 total_step = len(train_loader) for epoch in range(num_epochs): for i, (images, labels) in enumerate(train_loader): images = images.reshape(-1, 28*28).to(device) # 前向传递 outputs = model(images.float()) loss = criterion(outputs.squeeze(), labels.float()) # 反向传递及优化 optimizer.zero_grad() loss.backward() optimizer.step() if (i+1) % 100 == 0: print(f'Epoch [{epoch+1}/{num_epochs}], Step [{i+1}/{total_step}], Loss: {loss.item():.4f}') ``` 上述代码片段展示了如何通过简洁的方式设置通用的数据管道和训练循环结构,这不仅适用于当前案例中的逻辑回归模型,也能够方便地应用于其他类型的神经网络架构上[^2]。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值