5、玻尔兹曼机的隐藏单元与训练方法

最新推荐文章于 2025-11-02 09:34:33 发布

rust6ferris

最新推荐文章于 2025-11-02 09:34:33 发布

阅读量16

点赞数

CC 4.0 BY-SA版权

分类专栏：神经网络实现技术精要文章标签：玻尔兹曼机隐藏单元训练方法

本文链接：https://blog.youkuaiyun.com/rust6ferris/article/details/154625814

神经网络实现技术精要专栏收录该内容

27 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

玻尔兹曼机的隐藏单元与训练方法

1. 隐藏单元的引入

在实际应用中，玻尔兹曼机引入隐藏节点是一个重要特征。节点状态向量 $\mathbf{x}$ 可代表三种类型的变量：输入变量 $\mathbf{x}_i$、输出变量 $\mathbf{x}_o$ 和隐藏变量 $\mathbf{x}_H$。输入和输出变量对应可见单元，代表物理量，记 $\mathbf{x}_v = (\mathbf{x}_i, \mathbf{x}_o)^T$，而隐藏单元用于增加模型的灵活性。因此，$\mathbf{x} = (\mathbf{x}_v, \mathbf{x}_H) = (\mathbf{x}_i, \mathbf{x}_o, \mathbf{x}_H)$，相应的变量（节点）数量分别记为 $n_i$、$n_o$、$n_v$ 和 $n_H$，满足 $n = n_v + n_H = n_i + n_o + n_H$。

当玻尔兹曼机根据随机更新规则演化时，除了 $\mathbf{x} i$ 固定（在神经计算术语中称为“钳位”）的情况外，所有单元的处理方式相同。从长远来看，会从 $\mathbf{x}$ 的（联合）平稳分布中生成实现。实际中感兴趣的分布为：
- 当 $\mathbf{x}_i$ 不固定时：$P(\mathbf{x}_v) = \sum {\mathbf{x} H} p(\mathbf{x}_v, \mathbf{x}_H)$
- 当 $\mathbf{x}_i$ 固定时：$p(\mathbf{x}_o|\mathbf{x}_i) = \sum {\mathbf{x}_H} p(\mathbf{x}_o, \mathbf{x}_H|\mathbf{x