Ubuntu12 Mahout 搭建 测试

本文介绍如何安装配置Mahout及环境变量,并通过Kmeans聚类算法示例展示其基本使用流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、安装配置

1、安装、配置JDK,Hadoop(略)

 

2、下载Mahout,http://mahout.apache.org/ ,非源码下载解压即可用(src为源码包,需要用maven编译)。

 

3、添加环境变量修改/etc/profile 或者 ~/.bashrc ,添加export JAVA_HOME=/opt/java/jdk1.7.0_05

export JAVA_HOME=/home/alan/hadoop/hadoop-1.0.3

export HADOOP_CONF_DIR=/home/alan/hadoop/hadoop-1.0.3
export MAHOUT_HOME=/home/alan/mahout/mahout-distribution-0.7
#export HADOOP_HOME_WARN_SUPPRESS=1

通过$MAHOUT_HOME/bin/mahout 命令检测是否安装成功。

 

二、运行示例

 

1、启动 Hadoop (hadoop namenode -format;start-all.sh)

 

2、下载测试输入数据

 

3、把数据导入HDFS中


4、运行示例如:Kmeans聚类算法

$bin/hadoop jar $MAHOUT_HOME/mahout-examples-0.6-job.jar org.apache.mahout.clustering.
syntheticcontrol.kmeans.Job

他会启动多个job,输出output/大致如:

clusteredPoints/   clusters-2/        clusters-6/        data/ clusters-0/        clusters-3/        clusters-7/        clusters-1/        clusters-4/        clusters-8/        clusters-10-final/ clusters-5/        clusters-9/

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值