ResNet(Residual Network)是一种非常流行的深度学习模型,特别适用于图像分类任务。ResNet通过引入“残差连接”(residual connections)解决了深层网络中的梯度消失问题,使得训练非常深的神经网络成为可能。
下面是一个使用PyTorch实现ResNet进行图像分类的示例代码。我们将使用CIFAR-10数据集进行训练和测试。
首先,确保你已经安装了必要的库:
pip install torch torchvision
注意:具体需要依据cuda版本来选择对应版本
2. 导入必要的库
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
import torchvision.datasets as datasets
from torchvision.models import resnet18
3. 定义ResNet模型
我们可以使用TorchVision中预定义的ResNet模型,也可以自己定义一个简单的ResNet模型。这里我们使用TorchVision中的`resnet18`模型。
# 使用预定义的ResNet18模型
model = resnet18(pretrained=False, num_classes=10) # CIFAR-10有10个类别
4. 加载CIFAR-10数据集
# 数据预处理
transform = transforms.Compose([
transforms.RandomHorizontalFlip(),
transforms.RandomCrop(32, padding=4),
transforms.ToTensor(),
transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)),
])
# 加载CIFAR-10数据集
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.CIFAR10(root='./data', train=False, download=True, transform=transform)
# 创建数据加载器
train_loader = DataLoader(train_dataset, batch_size=128, shuffle=True, num_workers=2)
test_loader = DataLoader(test_dataset, batch_size=128, shuffle=False, num_workers=2)
5. 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.1, momentum=0.9, weight_decay=5e-4)
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=30, gamma=0.1)
```
### 6. 训练模型
```python
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)
num_epochs = 100
for epoch in range(num_epochs):
model.train()
running_loss = 0.0
for i, (inputs, labels) in enumerate(train_loader):
inputs, labels = inputs.to(device), labels.to(device)
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
running_loss += loss.item()
if i % 100 == 99: # 每100个batch打印一次损失
print(f'Epoch [{epoch + 1}/{num_epochs}], Step [{i + 1}/{len(train_loader)}], Loss: {running_loss / 100:.4f}')
running_loss = 0.0
scheduler.step()
# 每个epoch结束后在测试集上评估模型
model.eval()
correct = 0
total = 0
with torch.no_grad():
for inputs, labels in test_loader:
inputs, labels = inputs.to(device), labels.to(device)
outputs = model(inputs)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
print(f'Epoch [{epoch + 1}/{num_epochs}], Test Accuracy: {100 * correct / total:.2f}%')
6. 保存模型
训练完成后,可以保存模型的权重:
torch.save(model.state_dict(), 'resnet18_cifar10.pth')
7. 加载模型并进行预测
model.load_state_dict(torch.load('resnet18_cifar10.pth'))
model.eval()
# 使用模型进行预测
with torch.no_grad():
inputs, labels = next(iter(test_loader))
inputs, labels = inputs.to(device), labels.to(device)
outputs = model(inputs)
_, predicted = torch.max(outputs.data, 1)
print(f'Predicted: {predicted}')
以上展示了如何使用PyTorch实现ResNet模型进行CIFAR-10图像分类任务。具体应用时可以根据需要调整模型结构、超参数和数据增强方法,以获得更好的性能。
如果你有GPU,建议将模型和数据移动到GPU上进行训练,以加速训练过程。
7760

被折叠的 条评论
为什么被折叠?



