循环网络学习方法解析
在神经网络领域,循环网络(Recurrent Networks)因其在处理序列数据方面的独特能力而备受关注。本文将深入探讨循环网络的相关理论和学习方法,包括平均场自由能、循环反向传播、时间序列学习等内容。
1. 平均场自由能与玻尔兹曼机
首先,我们来了解平均场自由能(Mean Field Free Energy)的概念。设 $p_f$ 是 $S_i$ 取值为 $\pm1$ 的概率,由于 $p_f + p_i = 1$ 且 $m_i$ 满足一定关系,我们可以得到 $p_i$ 的表达式:
[p_i = \frac{1 \pm m_i}{2}]
进而,平均场自由能 $F_{MF}$ 的表达式为:
[F_{MF} = \sum_{ij} W_{ij} u_{ij} m_j + \sum_{i} \left(\frac{1 + m_i}{2} \log \frac{1 + m_i}{2} + \frac{1 - m_i}{2} \log \frac{1 - m_i}{2}\right)]
通过对 $F_{MF}$ 关于 $m_i$ 求偏导并令其为 0,可得到相关结果。同时,我们可以将玻尔兹曼机的确定性版本独立看待,考虑最小化代价函数:
[E_{MF} = E_0 + \beta [F_{0F} - F_{MF}]]
使用梯度下降法进行最小化,可得到权重更新公式:
[\Delta W_{pq} = \eta \beta [m_f^m f - m_i m_j]]
2. 循环反向传播
循环反向传播(Recurrent Back-Propagation)是一种将反向传播算法扩展到任意
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



