不确定数据上的Top-k典型性查询
1. 局部典型性近似相关计算
在处理不确定数据时,涉及到中心、半径和σ邻域的计算,这些计算是后续典型性查询的基础。
- 中心计算 :对于集合$R$中的每个实例$x$,其中心得分是$x$到$R$中另一个点的最大距离。选择$R$中中心得分最小的实例作为中心。该中心近似过程在计算几何中常用,每个节点$N$的计算时间为$O(|O_N|)$,LT树中所有节点的计算时间为$O(|O|\log_t |O|)$。
- 半径计算 :选择节点$N$的中心$c$后,半径是$c$与$N$处其他实例之间的最大距离。每个节点$N$的计算时间为$O(|O_N|)$,LT树中所有节点的计算时间为$O(|O|\log_t |O|)$。
- σ邻域计算 :使用LT树中的范围查询来计算LT树中每个节点$N$的$O_N$的σ邻域的超集,该超集的典型性近似效果不低于使用σ邻域。计算超集时,从根节点开始,使用$N$的近似中心和半径迭代搜索完全位于$N$的σ邻域内的节点。一旦节点$N’$的所有对象都在$N$的σ邻域内,就用$N’$表示它们,不再搜索$N’$的子树。
以下是这些计算步骤的mermaid流程图:
graph TD;
A[开始] --> B[计算中心];
B --> C[计算半径];
C --> D[计算σ邻域];
D --> E[结束];
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



