深度生成模型:原理、应用与评估
在机器学习领域,生成模型是一类强大的工具,它能够学习数据的概率分布,并根据学习到的分布生成新的数据。本文将深入探讨多种深度生成模型,包括它们的原理、训练方法、应用场景以及评估指标。
1. 玻尔兹曼机(Boltzmann Machines)
玻尔兹曼机最初是作为一种学习二进制向量任意概率分布的通用“连接主义”方法被引入的。它是基于能量的模型,通过能量函数定义联合概率分布:
[P(x) = \frac{\exp(-E(x))}{Z}]
其中,(E(x)) 是能量函数,(Z) 是确保所有概率之和为 1 的配分函数。玻尔兹曼机的能量函数通常表示为:
[E(x) = -x^TUx - b^Tx]
其中,(U) 是权重矩阵,(b) 是偏置向量。
当并非所有变量都被观察到时,玻尔兹曼机的潜在变量可以像多层感知机中的隐藏单元一样,对可见单元之间的高阶交互进行建模,从而成为离散变量概率质量函数的通用近似器。
1.1 玻尔兹曼机学习
玻尔兹曼机的学习算法通常基于最大似然估计。由于所有玻尔兹曼机的配分函数都难以处理,因此最大似然梯度必须使用近似技术进行计算。在基于最大似然的学习规则下,连接两个单元的特定权重的更新仅取决于这两个单元在不同分布下的统计信息,这种学习规则具有“局部性”,使得玻尔兹曼机的学习在生物学上具有一定的合理性。
1.2 受限玻尔兹曼机(Restricted Boltzmann Machines)
受限玻尔兹曼机(RBM)是深度概率模型中最常见的构建块之一。它是一种无向概率图模型,包含一层可观察变量和一层潜在变量,且可见层和隐藏
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



