6、数据查询与分析相关技术研究

数据查询与分析相关技术研究

1. 典型性查询相关研究

1.1 Top-k 简单典型性查询与离散 k - 中值问题

Top - k 简单典型性查询和离散 k - 中值问题都旨在从一组实例中找出优化与其他实例关系得分的实例。不过,二者要优化的函数不同,离散 k - 中值问题的方法不能直接用于回答 Top - k 典型性查询。此外,在离散 k - 中值问题中,k 个中值对象之间没有排名,而 Top - k 代表性典型性查询会按顺序返回 k 个对象。

1.2 聚类分析

聚类分析将一组数据对象划分为较小的相似对象集合,聚类方法可分为以下几类:
| 聚类方法类型 | 描述 | 示例 |
| — | — | — |
| 划分方法 | 将对象划分为 k 个簇,并优化某些选定的划分准则,k 是用户指定的参数 | K - means、K - medoids、CLARANS |
| 层次方法 | 执行一系列划分,将数据对象分组为簇的树结构 | BIRCH、CURE、Chameleon |
| 密度 - 基于方法 | 使用局部簇准则,将数据空间中密集且与其他数据对象由低密度区域分隔的区域作为簇 | DBSCAN、OPTICS、DENCLUE |
| 网格 - 基于方法 | 使用多分辨率网格数据结构,通过查找密集网格单元形成簇 | STING、CLIQUE |

典型性分析和聚类分析都考虑对象之间的相似性,但目标不同。聚类分析侧重于划分数据对象,而典型性分析旨在找到代表性实例。在一些研究中,使用簇质心来代表整个簇,但一般来说,簇的质心可能不是代表性点。例如,在划分聚类方法中,中位数常被视为簇质心,但它

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值