基于模板的概率模型表示:原理、应用与案例
1. 引言
在概率建模领域,传统的概率图形模型(如贝叶斯网络或马尔可夫网络)通常针对一组固定的随机变量定义联合分布。这种基于变量的模型在许多情况下很有用,例如医疗诊断网络可以应用于多个患者,尽管患者的症状和疾病表现不同,但都可以用相同的属性集来描述,只是属性值有所差异。
然而,在许多实际领域中,概率模型所涉及的空间远比一组固定变量所能编码的要复杂。例如,在时间序列场景中,我们需要表示系统状态随时间变化的分布。像在重症监护室监测患者状态,我们会定期获取心率、血压、心电图等传感器读数,并希望跟踪患者随时间的状态变化。又如,跟踪机器人在环境中移动时的位置,我们期望一个模型能适用于不同长度甚至无限长的轨迹。
在遗传学领域,情况更为复杂。每个谱系(家谱)包含一组具有各自属性的个体,我们的概率模型需要对所有家庭成员的属性进行联合分布编码。显然,无法用一个基于变量的单一模型普遍适用于所有家庭,因为每个家庭的家谱结构不同,代表遗传过程的网络具有不同的随机变量和连接方式。不过,基因从父母传递给子女的机制在不同个体和不同家谱中是相同的。
基于这些情况,我们希望构建一个单一、紧凑的模型,为同一类型的整个分布类提供模板,如不同长度的轨迹或不同的家谱。基于模板的表示方法主要用于两种场景:一是时间建模,动态贝叶斯网络语言使我们能够构建一个紧凑的模型,捕捉系统动态特性并生成不同轨迹的分布;二是涉及多个相互关联对象的领域,如遗传学,已有多种语言可用于生成不同世界的分布,每个世界都有自己的个体集和它们之间的关系。
当我们采用更高级的表示方法来建模对象、关系和关于这些实体的概率陈述时,就可以使用更丰富、更具表现力的语言,并进行基于变量
超级会员免费看
订阅专栏 解锁全文
2031

被折叠的 条评论
为什么被折叠?



