









优点:梯度永远是常数,会带来稳定性上的好处。
缺点:零点处不可导,此处梯度剧烈变化,这种不平滑性导致在预测值与真实值相差比较小的时候变得不太稳定。

也可以自己提出损失函数。


因此,分析损失函数时,可从其梯度函数的图像入手,分析当预测值与真实值相差较大或者较小时,进行更新会是怎样的情况。
import torch
import torchvision
from torch.utils import data
from torchvision import transforms
from d2l import torch as d2l
d2l.use_svg_display() # 用svg显示图片,清晰度更高
# 通过框架中的内置函数将Fashion-MNIST数据集下载并读取到内存中
# 通过ToTensor实例将图像数据从PIL类型变换成32位浮点数格式
# 并除以255使得所有像素

这篇博客介绍了Fashion-MNIST数据集的加载和可视化,并探讨了损失函数在预测值与真实值差异较大或较小时的影响。通过PyTorch实现了softmax回归模型的训练和评估,展示了训练过程中的损失和准确率变化。最后,用简洁的模型再次训练并进行了预测。
最低0.47元/天 解锁文章
4271





