Hadoop初体验

本文介绍了Hadoop初学者在使用HDFS时执行的shell命令,如创建目录、上传文件和查看存储空间。接着,通过MapReduce和YARN,作者演示了如何计算Pi值和进行词频统计,并提到了通过WebUI监控运行结果。所有示例都基于Hadoop3.1.4版本的官方示例jar包。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HDFS初体验

在这里插入图片描述

image.png


HDFS shell常用命令

# 在/目录创建一个目录
hdaoop fs -mkdir /itcast

# 上传文件到/itcast目录中
hadoop fs -put zookeeper.out /itcast

# 查看/目录
hadoop fs -ls /

# 查看存储余量
hdfs dfs -df -h

image.png
在这里插入图片描述

Web UI页面操作

image.png


思考

image.png


Hadoop MapReduce +YARN初体验

# 官方自带的示例jar包目录
/export/server/hadoop-3.1.4/share/hadoop/mapreduce

hadoop-mapreduce-examples-3.1.4.jar是官方提供的示例jar包。
image.png


计算圆周率Pi的值–官方示例

# 进入到官方示例jar包目录下
cd /export/server/hadoop-3.1.4/share/hadoop/mapreduce

# 计算圆周率Pi的值
hadoop jar hadoop-mapreduce-examples-3.1.4.jar pi 2 4

第一步是先连接到YARN集群主角色ResourceManager,找YARN申请运算资源
image.png


image.png


词频统计–官方示例

# 进入到官方示例jar包目录下
cd /export/server/hadoop-3.1.4/share/hadoop/mapreduce

# 统计词频
## hadoop jar jar包名 统计词频参数 指定统计文件 结果输出文件
hadoop jar hadoop-mapreduce-examples-3.1.3.jar wordcount /input/hlm.txt /out/hlmcount

第一步是先连接到YARN集群主角色ResourceManager,找YARN申请运算资源
image.png

# 查看统计输出结果
hdfs dfs -cat /out/hlmcount/part-r-00000

image.png


通过webui查看运行结果

image.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

教Linux的李老师

赞赏是第一生产力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值