数据挖掘中的聚类算法与应用综述
1. 数据挖掘相关基础概念
在数据挖掘领域,有众多重要的概念和算法。
- 构造性归纳 :构造性归纳是一种能够生成输入数据中不存在的新描述符的归纳形式。它可以帮助我们从现有的数据中挖掘出更有价值的信息,发现隐藏的模式和规律。
- 基于内容的过滤 :也称为基于内容的推荐,在信息检索中十分常见。它通过比较描述项目的内容表示与用户感兴趣的内容表示,为用户提供相关的文档推荐。例如,在新闻推荐系统中,根据用户过去阅读的新闻主题和关键词,为用户推送相似主题的新闻。
- 持续学习 :也叫终身学习,是一种可以持续添加新数据而无需停止或冻结更新的学习系统。通常需要增量学习和在线学习作为组成部分,但并非所有增量学习系统都具备持续学习的能力,因为学习效果可能会在一段时间后下降。
- 连续属性 :连续属性可以在数值范围内的数轴上取所有值。例如,温度、身高、体重等都是连续属性。
- 对比集挖掘 :属于有监督的描述性规则归纳领域。其问题定义为寻找对比集,即属性和值的合取,这些合取在不同组之间的分布有显著差异。例如,在医学研究中,对比不同治疗方法下患者的康复情况,找出对康复有显著影响的因素组合。
2. 相关算法研究
在数据挖掘中,有许多经典的算法和研究成果。
|作者|年份|研究内容|
| ---- | ---- | ---- |
|Bucila C等|2003年|提出DualMiner,一种用于带约束项集的双剪
超级会员免费看
订阅专栏 解锁全文
803

被折叠的 条评论
为什么被折叠?



