mahout 是一个开源的旨在为实际问题提供可伸缩性算法的软件。
官方主页:http://mahout.apache.org/
QuickStart:https://cwiki.apache.org/confluence/display/MAHOUT/Quickstart
目前的版本是0.4 ,此例展示了在eclipse下如何配置并应用mahout到你的程序中。
环境:eclipse +maven(m2eclipse)+ mahout 0.4 +jdk 1.6
配置:
Step 1:
在eclipse中新建一个maven程序 在”Select an Archetype“ 中选择”maven-Archetype-QuickStart“ 即可。
Step 2:
打开pom.xml 加入一些必备的jar。
点击 pom.xml 下的dependencies选项卡,在dependencies出点击add。 在弹出的对话框中输入”mahout“ 稍等片刻就会出来很多的jar包,选择合适的mahout包,一般来说,如果做的很简单的程序,选择mahout-core 就行,如果需要分布计算则需要加入 hadoop。
保存pom.xml 这是程序就会自动下载你所选择的jar包。
实例:
好了我们用一个例子来说明吧:
新建一个class 写入以下代码:
运行结果:
RecommendedItem[item:104, value:4.257081]
RecommendedItem[item:106, value:4.0]
其中intro.csv 的格式如下:
Pom.xml 文件如下: