
Mahout
光于前裕于后
本人有多年大数据与机器学习开发经验,并乐于总结与分享,如有侵权或写的不对的地方可以私信我,有问题也可以问我哟,free~
展开
-
Mahout开发中发现缺少MySQLJDBCDataModel类
在pom中加入<dependency> <groupId>org.apache.mahout</groupId> <artifactId>mahout-core</artifactId> <version>0.9-cdh5.4.5</version></dependency>发现并没有引入org.apache.mahout.cf.taste.impl原创 2016-10-14 17:33:50 · 3835 阅读 · 3 评论 -
Mahout聚类分析
转自:http://www.cnblogs.com/jerome-rong/archive/2012/05/22/2513262.html 写的很好!聚类分析什么是聚类分析?聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对转载 2016-10-09 14:26:35 · 1285 阅读 · 0 评论 -
Mahout K-Means输出结果解析
怎么使用Mahout做聚类有空我会专门写的,这篇博客主要为了讲一下Mahout处理的结果。 Mahout版本为0.9,数据没做归一化、标准化,只是为了测试。输出目录下有clusteredPoints、cluster-x、cluster-(x+1)-final等几个文件夹,x表示第x次迭代,每次的迭代结果都会存到cluster-x,最后一次(x+1)迭代结果存在cluster-(x+1)-final原创 2016-10-19 17:12:09 · 4314 阅读 · 0 评论