mahout下splitDataset出错,以及mahout在hadoop-2.2.7下进行算法时报错问题:
mahout支持hadoop-1.** 版本,需要自己编译mahout源码,支持hadoop-2.+版本。
1、在mahout源码目录下运行mvn clean install -Dhadoop2 -Dhadoop.2.version=2.2.7 -DskipTests
2、下载相关的jar包放入相关的项目中。参考下面的网页
http://www.linuxidc.com/Linux/2014-04/99856.htm
https://issues.apache.org/jira/browse/MAHOUT-1329
http://stackoverflow.com/questions/22702947/mahout-0-9-and-hadoop-2-2-0-found-interface-org-apache-hadoop-mapreduce-jobcon
http://blog.youkuaiyun.com/fansy1990/article/details/23261633?locationNum=3&fps=1