不确定数据上的概率排名查询
在数据处理和分析中,不确定数据的处理是一个重要的课题。当面对不确定数据时,如何进行有效的排名查询是一个关键问题。本文将介绍几种针对不确定数据的基本排名查询方法,包括简单典型性查询、判别典型性查询、代表性典型性查询,以及在多个不确定对象中对不确定实例进行排名的方法。
1. 基本典型性查询
1.1 简单典型性
简单典型性的核心思想是,如果一个实例在不确定对象中更有可能出现,那么它就比其他实例更具典型性。具体来说,给定一个不确定对象 $O$,其属性为 $A_1, \cdots, A_n$,以及感兴趣的属性子集 $A_{i1}, \cdots, A_{il}$,设 $X$ 是生成 $O$ 中实例的 $n$ 维随机向量,实例 $o \in O$ 相对于 $X$ 在属性 $A_{i1}, \cdots, A_{il}$ 上的简单典型性定义为:
$T_{A_{i1}, \cdots, A_{il}}(o, X) = L_{A_{i1}, \cdots, A_{il}}(o|X)$
其中,$L_{A_{i1}, \cdots, A_{il}}(o|X)$ 是在 $o$ 是 $X$ 的样本的条件下,$o$ 在属性 $A_{i1}, \cdots, A_{il}$ 上的似然度。
在实际应用中,由于随机向量 $X$ 的分布通常是未知的,我们使用 $T_{A_{i1}, \cdots, A_{il}}(o, O) = L_{A_{i1}, \cdots, A_{il}}(o|O)$ 作为 $T_{A_{i1}, \cdots, A_{il}}(o, X)$ 的估计值,其中 $L_{A_{i1}, \cdots, A_{il}}(o|
超级会员免费看
订阅专栏 解锁全文
25

被折叠的 条评论
为什么被折叠?



