hadoop学习(5)—— 伪分布下运行一个简单的实例

本文详细介绍如何使用Hadoop MapReduce进行数据处理实战,包括创建HDFS目录、配置mapred-site.xml、运行MapReduce示例程序grep并获取最终输出结果等步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.创建目录

[root@hadoop-yarn hadoop-2.6.5]# bin/hdfs dfs -mkdir /user
[root@hadoop-yarn hadoop-2.6.5]# bin/hdfs dfs -mkdir /user/cyhp
[root@hadoop-yarn hadoop-2.6.5]# bin/hdfs dfs -mkdir /user/cyhp/input
[root@hadoop-yarn hadoop-2.6.5]# bin/hdfs dfs -ls -R /
[root@hadoop-yarn hadoop-2.6.5]# bin/hdfs dfs -put etc/hadoop/*.xml /user/cyhp/input
[root@hadoop-yarn hadoop-2.6.5]# bin/hdfs dfs -ls /user/cyhp/input

2.本地运行,注销mapred-site.xml中关于yarn的配置

<!-- <property> -->
        <!-- <name>mapreduce.framework.name</name> -->
        <!-- <value>yarn</value> -->
<!-- </property> -->

3.运行,

    [root@hadoop-yarn hadoop-2.6.5]# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar grep /user/cyhp/input /user/cyhp/output 'dfs[a-z.]+'

4.下载运行结果

    [root@hadoop-yarn hadoop-2.6.5]# bin/hdfs dfs -get /user/cyhp/output/part* . 

5.获取运行结果

[root@hadoop-yarn hadoop-2.6.5]# cat part-r-00000 
1   dfsadmin
1   dfs.replication
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值