ResNet图像分类

部署运行你感兴趣的模型镜像

ResNet(Residual Network)是一种非常流行的深度学习模型,特别适用于图像分类任务。ResNet通过引入“残差连接”(residual connections)解决了深层网络中的梯度消失问题,使得训练非常深的神经网络成为可能。

下面是一个使用PyTorch实现ResNet进行图像分类的示例代码。我们将使用CIFAR-10数据集进行训练和测试。

首先,确保你已经安装了必要的库:

pip install torch torchvision

注意:具体需要依据cuda版本来选择对应版本

PyTorch

2. 导入必要的库

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
import torchvision.datasets as datasets
from torchvision.models import resnet18

3. 定义ResNet模型

我们可以使用TorchVision中预定义的ResNet模型,也可以自己定义一个简单的ResNet模型。这里我们使用TorchVision中的`resnet18`模型。

# 使用预定义的ResNet18模型
model = resnet18(pretrained=False, num_classes=10)  # CIFAR-10有10个类别

 4. 加载CIFAR-10数据集

# 数据预处理
transform = transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.RandomCrop(32, padding=4),
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
])

# 加载CIFAR-10数据集
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.CIFAR10(root='./data', train=False, download=True, transform=transform)

# 创建数据加载器
train_loader = DataLoader(train_dataset, batch_size=128, shuffle=True, num_workers=2)
test_loader = DataLoader(test_dataset, batch_size=128, shuffle=False, num_workers=2)

5. 定义损失函数和优化器

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.1, momentum=0.9, weight_decay=5e-4)
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=30, gamma=0.1)
```

### 6. 训练模型

```python
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

num_epochs = 100

for epoch in range(num_epochs):
    model.train()
    running_loss = 0.0
    for i, (inputs, labels) in enumerate(train_loader):
        inputs, labels = inputs.to(device), labels.to(device)
        
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        
        running_loss += loss.item()
        
        if i % 100 == 99:  # 每100个batch打印一次损失
            print(f'Epoch [{epoch + 1}/{num_epochs}], Step [{i + 1}/{len(train_loader)}], Loss: {running_loss / 100:.4f}')
            running_loss = 0.0
    
    scheduler.step()
    
    # 每个epoch结束后在测试集上评估模型
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for inputs, labels in test_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            outputs = model(inputs)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
    
    print(f'Epoch [{epoch + 1}/{num_epochs}], Test Accuracy: {100 * correct / total:.2f}%')

6. 保存模型

训练完成后,可以保存模型的权重:

torch.save(model.state_dict(), 'resnet18_cifar10.pth')

7. 加载模型并进行预测

model.load_state_dict(torch.load('resnet18_cifar10.pth'))
model.eval()

# 使用模型进行预测
with torch.no_grad():
    inputs, labels = next(iter(test_loader))
    inputs, labels = inputs.to(device), labels.to(device)
    outputs = model(inputs)
    _, predicted = torch.max(outputs.data, 1)
    print(f'Predicted: {predicted}')

以上展示了如何使用PyTorch实现ResNet模型进行CIFAR-10图像分类任务。具体应用时可以根据需要调整模型结构、超参数和数据增强方法,以获得更好的性能。

如果你有GPU,建议将模型和数据移动到GPU上进行训练,以加速训练过程。

您可能感兴趣的与本文相关的镜像

PyTorch 2.7

PyTorch 2.7

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

reset2021

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值