不确定数据上的Top-k典型性查询方法解析
在处理不确定数据时,top-k典型性查询是一个重要的问题,它有助于我们从大量不确定的数据中找出最具代表性的实例。本文将详细介绍解决该问题的多种方法,包括精确算法、随机锦标赛算法以及局部典型性近似算法等。
1. 简单典型性查询的基础
在进行top-k典型性查询时,核函数和带宽值的选择会影响查询结果。实验表明,使用表4.1中不同的核函数计算出的结果大多是一致的。而且,在 $h = 1.06s\sqrt[5]{n}$ 附近使用不同的带宽值也能得到一致的答案。
| 名称 | 核函数 |
|---|---|
| 均匀核 | $K(u) = \frac{1}{2}I( |
| 三角核 | $K(u) = (1 - |
| Epanechnikov核 | $K(u) = \frac{3}{4}(1 - u^2)I( |
| 四次核 | $K(u) = \frac{15}{16}(1 - u^2)^2I( |
| 三重权核 | $K(u) = \frac{35}{32}(1 - u^2)^3I( |
| 高斯核 | $K(u |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



