
mahout
rolin-刘瑞
技术GEEK
展开
-
数据挖掘中的常用聚类算法-提纲
聚类相关的概念:相似性、距离度量(单连接、全连接、平均、质心、中心)、异常点算法分类:层次算法、划分算法层次算法:(凝聚、分裂)、谱系图的概念简单的凝聚算法——最近邻聚类:自增距离d至阀值、每次合并距离基于mst的层次凝聚聚类:从生成的mst上,根据距离合并簇分裂:基于mst的分裂,与上述mst凝聚相逆划分算法判定聚类转载 2014-04-14 11:45:00 · 6904 阅读 · 0 评论 -
Mahout安装与配置,以及结果查看
Mahout是Hadoop的一种高级应用。运行Mahout需要提前安装好Hadoop。Hadoop的安装网上很多,并不复杂,这里不再讲述,接下来阐述怎么安装Mahout。1:下载二进制解压安装。到http://labs.renren.com/apache-mirror/mahout/0.7下载,我选择下载二进制包,直接解压及可。hadoop@ubuntu:~$ tar -zxvf转载 2014-04-14 11:49:20 · 7518 阅读 · 0 评论 -
java.lang.IncompatibleClassChangeError错误的解决
java.lang.IncompatibleClassChangeError: Found interface org.apache.hadoop.mapreduce.JobContext, but class was expected at org.apache.mahout.common.HadoopUtil.getCustomJobName(HadoopUtil.java:174)原创 2014-09-12 10:21:29 · 16580 阅读 · 0 评论