神经网络中的交叉熵

最新推荐文章于 2025-10-11 20:15:00 发布

原创

最新推荐文章于 2025-10-11 20:15:00 发布 · 3.4k 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#PyTorch #交叉熵 #神经网络

本文介绍了交叉熵作为分类问题损失函数的用途，特别是在神经网络的多分类任务中。通过示例解释了如何计算交叉熵，展示了它如何衡量预测概率分布与真实标签之间的距离。在PyTorch中，交叉熵通过torch.nn.CrossEntropyLoss函数实现，该函数内部包含了Softmax操作。

[参考《TensorFlow实战Google深度学习框架(第2版)》]

作为分类问题中的损失函数

在神经网络的多分类问题中，常常使用one-hot的方法设置n类输出，比如在手写体识别问题中，如果是数字1，神经网络的输出越接近[0,1,0,0,0,0,0,0,0,0]越好。那么如何衡量神经网络与label的接近程度呢？交叉熵是常用的使用方法。其刻画的是两个概率分布之间的距离。
交叉熵是信息论中的概念。对于给定的两个概率分布p和q，交叉熵的计算公式是(PyTorch中对数以自然常数e为底)：
$H(p,q)=-\sum_{i}p_i\,ln\, q_i$
在神经网络中常常通过一个Softmax层将原始输出层变成一个概率分布（神经网络图如下：）：
$y_{output}=softmax(y)_i=\frac{e^{yi}}{\sum_{j=1}^{n}e^{yj}}$

最低0.47元/天解锁文章

博客等级

码龄7年

11
原创

27
点赞

154
收藏

11
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

下一篇：: transforms图片处理操作

最新评论

将分类存储的图片切分为训练集、验证集和测试集(PyTorch实现）
浅水稻: pytorch有原生函数进行拆分数据集，只不过没有保存的方法，改改就行。 def split_dataset(source_dir, target_dir, ratio=(0.8, 0.2), seed=None, label_type='name'): ''' 数据集拆分为train和val数据集 :param source_dir:str - 原始数据集目录 :param source_dir:str - 目标数据集目录 :param ratio:tuple - train与val数据集大小的比例 :param seed:int - 随机种子，默认为空每次执行都会拆分成不同的数据集 :param label_type:str - name或者idx,拆分数据集的目录类别以名称命名还是索引命名 ''' dataset = datasets.ImageFolder(source_dir) train_path, val_path = [Path(target_dir) / split_name for split_name in ['train','val']] train_path.mkdir() val_path.mkdir() labels = dataset.classes if label_type == 'name' else dataset.class_to_idx.values() for label in labels: (train_path / str(label)).mkdir() (val_path / str(label)).mkdir() train_subset, val_subset = random_split(dataset, ratio, torch.manual_seed(seed) if seed else seed) for idx in train_subset.indices: sample = dataset.samples[idx] append_path = list(dataset.class_to_idx.keys

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。