数据查询与分析相关技术研究
1. 典型性查询相关研究
1.1 Top-k 简单典型性查询与离散 k - 中值问题
Top - k 简单典型性查询和离散 k - 中值问题都旨在从一组实例中找出优化与其他实例关系得分的实例。不过,二者要优化的函数不同,离散 k - 中值问题的方法不能直接用于回答 Top - k 典型性查询。此外,在离散 k - 中值问题中,k 个中值对象之间没有排名,而 Top - k 代表性典型性查询会按顺序返回 k 个对象。
1.2 聚类分析
聚类分析将一组数据对象划分为较小的相似对象集合,聚类方法可分为以下几类:
| 聚类方法类型 | 描述 | 示例 |
| — | — | — |
| 划分方法 | 将对象划分为 k 个簇,并优化某些选定的划分准则,k 是用户指定的参数 | K - means、K - medoids、CLARANS |
| 层次方法 | 执行一系列划分,将数据对象分组为簇的树结构 | BIRCH、CURE、Chameleon |
| 密度 - 基于方法 | 使用局部簇准则,将数据空间中密集且与其他数据对象由低密度区域分隔的区域作为簇 | DBSCAN、OPTICS、DENCLUE |
| 网格 - 基于方法 | 使用多分辨率网格数据结构,通过查找密集网格单元形成簇 | STING、CLIQUE |
典型性分析和聚类分析都考虑对象之间的相似性,但目标不同。聚类分析侧重于划分数据对象,而典型性分析旨在找到代表性实例。在一些研究中,使用簇质心来代表整个簇,但一般来说,簇的质心可能不是代表性点。例如,在划分聚类方法中,中位数常被视为簇质心,但它
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



