ResNet图像分类

原创已于 2025-02-19 10:50:12 修改 · 202 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#分类 #人工智能 #python

于 2025-02-19 10:21:56 首次发布

图像分类专栏收录该内容

8 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

ResNet（Residual Network）是一种非常流行的深度学习模型，特别适用于图像分类任务。ResNet通过引入“残差连接”（residual connections）解决了深层网络中的梯度消失问题，使得训练非常深的神经网络成为可能。

下面是一个使用PyTorch实现ResNet进行图像分类的示例代码。我们将使用CIFAR-10数据集进行训练和测试。

首先，确保你已经安装了必要的库：

pip install torch torchvision

注意：具体需要依据cuda版本来选择对应版本

PyTorch

2. 导入必要的库

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
import torchvision.datasets as datasets
from torchvision.models import resnet18

3. 定义ResNet模型

我们可以使用TorchVision中预定义的ResNet模型，也可以自己定义一个简单的ResNet模型。这里我们使用TorchVision中的`resnet18`模型。

# 使用预定义的ResNet18模型
model = resnet18(pretrained=False, num_classes=10)  # CIFAR-10有10个类别

4. 加载CIFAR-10数据集

# 数据预处理
transform = transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.RandomCrop(32, padding=4),
    transforms.ToTensor(),
    transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
])

# 加载CIFAR-10数据集
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.CIFAR10(root='./data', train=False, download=True, transform=transform)

# 创建数据加载器
train_loader = DataLoader(train_dataset, batch_size=128, shuffle=True, num_workers=2)
test_loader = DataLoader(test_dataset, batch_size=128, shuffle=False, num_workers=2)

5. 定义损失函数和优化器

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.1, momentum=0.9, weight_decay=5e-4)
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=30, gamma=0.1)
```

### 6. 训练模型

```python
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

num_epochs = 100

for epoch in range(num_epochs):
    model.train()
    running_loss = 0.0
    for i, (inputs, labels) in enumerate(train_loader):
        inputs, labels = inputs.to(device), labels.to(device)
        
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        
        running_loss += loss.item()
        
        if i % 100 == 99:  # 每100个batch打印一次损失
            print(f'Epoch [{epoch + 1}/{num_epochs}], Step [{i + 1}/{len(train_loader)}], Loss: {running_loss / 100:.4f}')
            running_loss = 0.0
    
    scheduler.step()
    
    # 每个epoch结束后在测试集上评估模型
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for inputs, labels in test_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            outputs = model(inputs)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
    
    print(f'Epoch [{epoch + 1}/{num_epochs}], Test Accuracy: {100 * correct / total:.2f}%')

6. 保存模型

训练完成后，可以保存模型的权重：

torch.save(model.state_dict(), 'resnet18_cifar10.pth')

7. 加载模型并进行预测

model.load_state_dict(torch.load('resnet18_cifar10.pth'))
model.eval()

# 使用模型进行预测
with torch.no_grad():
    inputs, labels = next(iter(test_loader))
    inputs, labels = inputs.to(device), labels.to(device)
    outputs = model(inputs)
    _, predicted = torch.max(outputs.data, 1)
    print(f'Predicted: {predicted}')

以上展示了如何使用PyTorch实现ResNet模型进行CIFAR-10图像分类任务。具体应用时可以根据需要调整模型结构、超参数和数据增强方法，以获得更好的性能。

如果你有GPU，建议将模型和数据移动到GPU上进行训练，以加速训练过程。

您可能感兴趣的与本文相关的镜像