可能性图形模型:不确定性建模的新视角
1. 数值编码与问题
在不确定性建模中,常使用[0,1]范围内的数值对信息进行编码。然而,对序数信息进行数值编码时,可能会产生不同的编码方式,进而得到不同的联合分布,特别是当变量具有不同的定义域大小时。这是因为在使用定性可能性网络进行建模时,信息提取过程是局部进行的(每个变量依赖于其父变量),但使用相同的单位尺度意味着存在一定的可比性。基于符号不确定性权重的方法或许能解决这一问题。对于因果可能性网络的提取,也有相关的提取方法被提出,该方法提供了噪声门,能更好地捕捉专家的见解和直觉,因为专家在指定可能原因的相对顺序时,往往比精确量化因果关系的强度更为得心应手。
2. 从数据中学习可能性网络
与从数据中学习贝叶斯网络类似,学习可能性网络的核心是从数据集中推导每个变量的结构和局部可能性表。这种学习方式在可能性分布的定量解释中具有重要意义,尤其适用于处理不精确数据、稀缺数据集以及包含缺失值的数据集。
- 结构学习 :旨在从数据中推断出能编码条件独立性的最佳有向无环图(DAG)。主要有两种方法:
- 基于约束的方法 :通过对训练数据集进行一系列测试,检测条件独立关系I,然后尝试找到满足I作为一组约束条件的DAG。例如,POSSCAUSE算法就是基于可能性分布之间的相似性度量来检查条件独立性。不过,这种方法的主要缺点是,即使变量数量较少,搜索空间也会非常大。
- 基于得分的方法 :这类方法并不探索整个搜索空间来寻找最适合数据的结构。它们基于启发式算法,从一个完全断开(或完全连接)的DAG开始。在每次迭代中,启
超级会员免费看
订阅专栏 解锁全文
3402

被折叠的 条评论
为什么被折叠?



