
mahout
azhao_dn
关注hadoop 数据挖掘
展开
-
基于Hadoop平台的并行数据挖掘算法工具-Dodo
查看原文 一 基于云计算的海量数据挖掘 2008年7 月,《Communications of the ACM》杂志发表了关于云计算的专辑,云计算因其清晰的商业模式而受到广泛关注,并得到工业和学术界的普遍认可。目前工业界推出的云计算平台有Amazon公司的EC2和S3,Google公司的Google Apps Engine, IBM公司的Blue Cloud,Microsoft转载 2012-05-31 15:17:46 · 13656 阅读 · 2 评论 -
Mahout聚类分析
查看原文 聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。 其实聚类是一个人们日常生活的常见行为,即所谓“物以类聚,人以群分”转载 2012-05-31 15:09:29 · 4044 阅读 · 0 评论