深度学习(花书)学习笔记——第十六章 深度学习中的结构化概率模型

本文探讨了非结构化建模面临的挑战及其对内存和处理速度的影响,并对比了结构化建模的优势。文中详细介绍了图模型的概念,包括有向图(信念网络/贝叶斯网络)和无向图(马尔科夫随机场),以及它们之间的转换方法。此外,还讨论了潜变量学习的重要性及常用的推断方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

非结构化建模的挑战

主要介绍非结构化对内存要求大,速度慢。而结构化相对好很多。主要例子,a影响b ,b影响c,非结构化的处理的话,还需要处理a影响c的情况,结构化不需要。

使用图描述模型结构

主要分为有向图和无向图,有向图又叫信念网络或贝叶斯网络。就像前面介绍的那样可以减少很多参数,适用于因果关系。

无向图又称马尔科夫随机场(MRF)或马尔科夫网络。

这里介绍了配分函数:配置分母的函数,让所有可能性之和为1。后面会有专门的章节介绍。

能量函数:所有概率不为0,通过指数运算可得。\tilde{p}(x) = exp(-E(x))

通常基于能量的模型也被称为玻尔兹曼机。rbm

分离和d-分离,分别存在于无向图和有向图。当两个变量集中间存在可观察变量时,并且不存在直连时,两个变量集就是分离的。

无向图和有向图可以相互转换,无向图转换为有向图时,通过一个拓扑排序,而后每个变量集针对后面所有的变量集都有一个指向其的链接。

因子图:无向图中添加一层方块区域,表达函数的作用于,解决无向图中表达的模糊性。如图

从图模型中采样

原始采样:按照拓扑的顺序采样。多个拓扑图时,任意一个顺序都可。但是只适用于有向图。无向图采样较复杂,使用Gibbs采样,下一章有介绍,较复杂。

结构化建模的优势

就是简化流程,将现有知识和知识的学习分开。

学习依赖关系

潜变量:无法被观察到的变量。

推断潜在变量的常用方法:

1、隐马尔可夫模型;

2、因子分析;

3、主成分分析;

4、偏最小二乘回归;

5、潜在语义分析和概率潜在语义分析;

6、EM算法。

就是学习潜变量,以及介绍潜变量的好处,高效表示。

推断和近似推断

具体介绍将在第十九章。就是深度学习可以应用于推断。

结构化概率模型的深度学习方法

深度学习的潜变量主要通过自主学习,而非人工设定。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值