从图像中区分鸟类和飞机:深度学习实践与挑战
1. 均方误差(MSE)在分类任务中的局限性
在分类任务里,当预测偏离目标时,交叉熵损失表现良好,在低损失区域,正确类别的预测概率可达 99.97%。而一开始被排除的均方误差(MSE)则过早饱和,尤其是在预测严重错误时。其根本原因在于,MSE 的斜率过低,无法弥补 softmax 函数在错误预测时的平缓特性。这就表明,MSE 不太适合用于概率分类工作。
2. 训练分类器
现在,我们重新使用之前写好的训练循环来训练模型,具体代码如下:
import torch
import torch.nn as nn
model = nn.Sequential(
nn.Linear(3072, 512),
nn.Tanh(),
nn.Linear(512, 2),
nn.LogSoftmax(dim=1))
learning_rate = 1e-2
optimizer = optim.SGD(model.parameters(), lr=learning_rate)
loss_fn = nn.NLLLoss()
n_epochs = 100
for epoch in range(n_epochs):
for img, label in cifar2:
out = model(img.view(-1).unsqueeze(0))
loss = loss_fn(out, torch.tensor([label]))
optimizer.zero_grad()
loss.
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



