Hadoop tutorial - 3 Hello MapReduce- 2015-3-30

本文介绍了如何使用HadoopFS上传文件到HDFS,并演示了使用Hadoop MapReduce进行数据处理的基本步骤,包括下载文件、查看目录、运行wordcount程序等操作。同时提供了解决系统空间不足问题的方法。

测试HDFS

上传文件到hdfs hadoop分布式文件系统

hadoop fs -put /opt/jdk.gz hdfs://master:9000/jdk

 

5/22/2017------------------------

17/05/21 22:55:06 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
put: Cannot create file/jdk._COPYING_. Name node is in safe mode.
忽略第一行错误,看第二行,是由于系统空间不足

df -hl命令查看系统空间使用情况

删除一些文件后,正常执行上传文件

5/22/2017------------------------

 

下载到linux文件系统

hadoop fs -get hdfs://master:9000/jdk /opt/jdk2

 

查看文件列表

hadoop fs -ls

 

例子-wordcount

上传包含各种单词的word文件到hdfs,然后执行以下命令,可以得到结果文件word-out

 hadoop jar hadoop-mapreduce-examples-2.6.0.jar wordcount hdfs://master:9000/word  hdfs://master:9000/word-out

默认在hdfs文件系统底下,所以也可以简写成以下

 hadoop jar hadoop-mapreduce-examples-2.6.0.jar wordcount /word  word-out-2

 

转载于:https://my.oschina.net/jayronwang/blog/393811

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值