为什么深度网络(vgg,resnet)最后都不使用softmax(概率归一)函数,而是直接加fc层?

本文解释了深度学习框架如何处理softmax,指出新版本如Pytorch和PaddlePaddle默认包含softmax,而早期版本可能需要手动添加。强调查看API文档的重要性,以防误解softmax的作用对模型收敛的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这个问题很简单,并不是没有使用softmax,而是没有显式使用softmax。

随着深度学习框架的发展,为了更好的性能,部分框架选择了在使用交叉熵损失函数时默认加上softmax,这样无论你的输出层是什么,只要用了nn.CrossEntropyLoss就默认加上了softmax。不仅是Pytorch,国内的飞桨PaddlePaddle2.0等框架也是这样。但在更早的一些版本,默认是不隐式添加softmax的,所以会有一部分教程/资料,要求在撰写对应代码时手动添加softmax。当然,自己的框架是否需要手动在输出层添加softmax,推荐看对应的API文档。道听途说不一定可取,毕竟一个softmax可以做分类,俩softmax搞不好就不收敛了
在这里插入图片描述

PyTorch中实现猫狗图像分类任务通常涉及以下几个步骤: 1. **数据预处理**: - 下载数据集,如ImageNet中的猫狗分类数据集,可以使用`torchvision.datasets`中的`CIFAR10`(小型)或`ImageFolder`(自定义目录下的图片)。 - 对图片进行预处理,包括缩放、裁剪、归化等操作,可以使用`transforms`模块。 2. **构建模型**: - 使用预训练的卷积神经网络(如ResNetVGG或DenseNet),PyTorch库如`torchvision.models`提供了些预训练模型。 - 可能需要调整模型结构以适应新的任务,比如去掉最后,添全连接,并设置适当的激活函数(如softmax用于多分类)。 3. **载预训练权重**: - 如果选择使用预训练模型,先将模型设为可训练(`.eval()`),然后通过`.load_state_dict()`载预训练的权值。 4. **定义损失函数和优化器**: - 使用交叉熵作为损失函数,`torch.nn.CrossEntropyLoss`。 - 选择个优化器,如SGD、Adam,`torch.optim.SGD`或`torch.optim.Adam`. 5. **训练循环**: - 定义训练和验证函数,遍历数据集,前向传播、计算损失、反向传播并更新权重。 - 调整批量大小(batch size)、学习率以及其他超参数。 6. **评估和预测**: - 在测试集上运行模型,计算准确率或其他指标。 - 对新图片进行预测时,对输入图片应用同样的预处理步骤,然后通过模型进行类别预测。 以下是个简单的示例代码片段: ```python import torch from torchvision import datasets, models, transforms # 数据预处理 transform = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) train_dataset = datasets.ImageFolder(root='path_to_train_data', transform=transform) test_dataset = datasets.ImageFolder(root='path_to_test_data', transform=transform) # 载预训练模型并调整最后 model = models.resnet18(pretrained=True) num_classes = len(train_dataset.classes) # 获取数据集类别数 model.fc = nn.Linear(model.fc.in_features, num_classes) device = torch.device("cuda" if torch.cuda.is_available() else "cpu") model.to(device) # 训练、验证、优化和损失函数 criterion = nn.CrossEntropyLoss() optimizer = torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.9) # 进行训练 for epoch in range(num_epochs): # ... ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值