
Kmeans
文章平均质量分 91
zhan8610189
这个作者很懒,什么都没留下…
展开
-
Mahout Kmeans Clustering 学习
一、Mahout命令使用合成控制的数据集 synthetic_control.data 可以从 此处下载,总共由600行X60列double型的数据组成, 意思是有600个元组,每个元组是一个时间序列。1. 把数据拷到集群上,放到kmeans/目录下hadoop fs -mv synthetic_control.data kmeans/synthetic_control.data...原创 2013-05-04 18:02:01 · 271 阅读 · 0 评论 -
Hama Kmeans Clustering学习
Hama 是BSP(Bulk Synchronous Parallel整体同步并行)计算框架的一种实现,类似Google研发的Pregel系统。跟前一篇<<Mahout KMeans Clustering学习>>的流程一致,分四不走,在这里我不再多说了。 BSP有三种特性:1. 局部计算,2. 节点通信,3. 全局栅栏同步。 这使得BSP能够很好地实现迭代计...原创 2013-05-05 00:16:25 · 150 阅读 · 0 评论