31、深度学习中的信息容量评估

最新推荐文章于 2025-11-25 14:31:30 发布

devops8pract

最新推荐文章于 2025-11-25 14:31:30 发布

阅读量35

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习的数学基石文章标签：深度学习信息容量评估熵变

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/devops8pract/article/details/151037186

深度学习的数学基石专栏收录该内容

58 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度学习中的信息容量评估

1. 熵变与信息损失

在某些变换过程中，正的熵变对应着信息的损失。收缩映射通常会导致信息损失，例如最大池化就是这类映射的一个例子。这种熵变的概念在分析神经网络中的熵流时非常有用。

2. 熵流

2.1 熵流的定义

考虑一个具有 $L$ 层的前馈神经网络，其各层的激活由随机向量变量 $X(\ell)$ 表示，其中 $0 \leq \ell \leq L$。第 $\ell$ 层激活的信息场 $I(\ell) = S(X(\ell))$ 可以通过熵函数 $H(X(\ell))$ 进行数值评估。

若第 $\ell - 1$ 层和第 $\ell$ 层的神经元数量相同，即 $d(\ell - 1) = d(\ell)$，且 $X(\ell) = f(X(\ell - 1))$，其中 $f$ 是确定性的光滑函数。设 $\Delta(\ell) = \det J_f(X(\ell - 1))$，则有：
[H(X(\ell)) = H(X(\ell - 1)) + E_{P_{X(\ell)}} [\ln |\Delta(\ell)|], 1 \leq \ell \leq L]

前馈神经网络的熵流定义为网络各层激活熵的序列 ${H(X(\ell))}_{0 \leq \ell \leq L}$。

2.2 熵流的变化

当进行分类任务时，前馈网络的熵流预计会减少到 $\log_2 c$ 比特，其中 $c$ 是类别数。这体现了网络对信息的组织和不确定性的降低。例如，将动物图片分类为哺乳动物和非哺乳动物时，即使输入图片的熵 $H(X(0))$ 很大，最后一层的熵

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。