Mahout安装(Hadoop 1.2.1 版本)

本文详细介绍了在Hadoop 1.2.1分布式集群环境下安装Mahout 0.9的全过程,包括安装介质上传、解压、环境变量配置、Hadoop启动与Mahout验证等步骤,并提供了测试数据下载、存储到HDFS及运行Mahout的具体操作。

1       安装环境

Hadoop1.2.1 分布式集群环境下安装(192.168.1.53-56

Mahout 0.9

2       安装介质

下载地址:http://archive.apache.org/dist/mahout/0.9/

文件名(二进制):mahout-distribution-0.9.tar.gz

3       安装步骤

3.1     上传安装介质:

#rz

上传目录为:/home/hadoop/

3.2     解压到相关目录

#cd   /app/hadoop/

#mkdir  mahout

#tar  -zxvf    /home/hadoop/mahout-distribution-0.9.tar.gz

重新命名解压的文件

# mv  mahout-distribution-0.9/   ./mahout

3.3     配置环境变量

1、配置

# vi /etc/profile

添加以内容:

export HADOOP_CONF_DIR=/app/hadoop/hadoop/conf

#Mathout

export MAHOUT_HOME=/app/hadoop/mahout

export MAHOUT_CONF_DIR=/app/hadoop/mahout/conf

export PATH=$PATH:$MAHOUT_HOME/conf:$MAHOUT_HOME/bin

 

//生效配置文件

#source  /etc/profile

 

2、分别将:mahout复制到(192.168.1.54-56

 

#tar  -zcvf   mahout.tar.gz   ./mahout

 

#scp  mahout.tar.gz    hadoop@192.168.1.54:/app/hadoop/

分别在(54-56执行解压)

#tar  -zxvf  mahout.tar.gz

3、分别在192.168.1.5456(重复第1步环境变量配置)

(注:#source /etc/profile

3.4     启动Hadoop

#./start-all.sh

#jps

3.5     验证是否安装成功

#mahout –help

4       测试验证

4.1     下载测试数据

#wget  http://archive.ics.uci.edu/ml /databases/synthetic_control /synthetic_control.data

4.2     将文件存储到HDFS

#hadoop fs  -mdkir  testdata

#hadoop fs  -put   /home/hadoop/synthetic_control.data   testdata

#hadoop fs  -ls     testdata

 

4.3     运行mahout

#mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

4.4     查看结果

#hadoop  fs  -ls  ouput

 


 

转载于:https://www.cnblogs.com/scwanglijun/p/3888722.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值