
聚类
文章平均质量分 78
sumofe
积攒正能量。
展开
-
聚类(一)
数 据 挖 掘 课——聚 集(一)一,什么是聚类?聚类:-将一个对象的集合分割成几个类,每个类内的对象之间是相似的,但与其他类的对象是不相似的。评判聚类好坏的标准:1,能够适用于大数据量。2,能应付不同的数据类型。3,能够发现不同类型的聚类。4,使对专业知识的要求降到最低。5,能应付脏数据。6,对于数据不同的顺序不敏感。7,能应付很多类型的数据。8,模型可解释,可使用。转载 2014-11-14 08:47:57 · 774 阅读 · 0 评论 -
聚类(二)
聚 集(二)2,Clara算法。上次课提到K-medoids算法不适合于大数据量的计算。这次课我们介绍Clara算法,这是一种基于采用的方法,它能够处理大量的数据。Clara算法的思想就是用实际数据的抽样来代替整个数据,然后再在这些抽样的数据上利用K-medoids算法得到最佳的medoids。Clara算法从实际数据中抽取多个采样,在每个采样上都用K-medoids算法得转载 2014-11-14 08:54:41 · 1191 阅读 · 0 评论 -
基于模型的聚集方法
1, 统计的方法:概念聚类是在机器学习中聚类的一种形式,与其他通常的聚类方法(定义相似的记录为一个类)不同的是,概念聚类则更进一步来找出每一个类的特征描述。这样,概念聚类就有两步组成,首先,进行聚类,然后找出特征。这样聚类的质量就不仅仅是单个记录的一个函数,它还综合了一些得出的类的描述。大多数的概念聚类采用了一个统计的方法——在决定一个类的时候,用可能性的描述语句。COBWEB是一转载 2014-11-14 08:59:21 · 1580 阅读 · 0 评论