神经网络中的信息最大化与神经元专业化
在神经网络的研究中,信息最大化和神经元专业化是两个重要的概念。本文将深入探讨这两个概念,包括相关的原理、不同噪声情况下的分析以及神经元专业化的转变过程。
1. 玻尔兹曼机学习规则
玻尔兹曼机学习规则具有一定的优势和劣势。其优势在于它旨在优化一个明确定义且合理的性能指标,并且能够清晰地处理概率数据,这在现实世界的信息处理中是更为自然的情况。然而,它的缺点也很明显,通常速度非常慢,因为每一次微小的参数修改都需要对一个递归随机系统进行平衡,这显然会消耗大量的 CPU 时间。具体操作步骤如下:
1. 让所有隐藏和输出神经元自由演化,直到达到平衡状态,并测量平均值 ⟨sisj⟩− 和 ⟨si⟩−。
2. 针对根据所需分布 q(x) = ∑y q(x, y) 生成的许多输入配置 x,重复上述步骤。
3. 将步骤 1 和 2 的结果代入公式 (14.18) 并执行该规则。
2. 最大信息保存原理
2.1 线性神经元与高斯输出噪声
考虑一个单个线性神经元 y: IRN → IR,其输出 y(x) 受到高斯噪声源 ξ 的干扰,具体形式为:
[y(x) = \sum_{i=1}^{N} w_ix_i + \xi]
[p(\xi) = \frac{e^{-\xi^2/2\sigma^2}}{\sigma\sqrt{2\pi}}]
其中,{wi} 是突触权重,噪声强度由 σ² = ⟨ξ²⟩ 衡量。我们假设输入信号 ⟨xi⟩ = 0,并且与噪声源 ξ 统计独立,同时未受干扰的信号 z(x) = ∑i=1N wixi 具有高斯概率分布。
由于没
超级会员免费看
订阅专栏 解锁全文
4003

被折叠的 条评论
为什么被折叠?



