如何使用Hadoop在Ubantu18.04上运行WordCount？

tangmz2020

已于 2023-03-21 11:47:19 修改

阅读量513

点赞数 2

CC 4.0 BY-SA版权

文章标签： hadoop 大数据 hdfs

于 2023-03-20 22:17:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/tangmz2020/article/details/129675291

本文详细介绍了如何在Linux系统中启动Hadoop，包括执行start-dfs.sh启动Hadoop，使用jps检查进程，创建HDFS目录，上传文件，运行WordCount示例程序以及查看结果。主要涉及的命令有hdfsdfs相关的如mkdir、ls、put、cat等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前置条件

在Linux上安装Hadoop
启动Hadoop

./sbin/start-dfs.sh

操作步骤

（1）使用"jps"查看java虚拟进程

（2）创建test1

hdfs dfs -mkdir /test1

mkdir命令用来在指定的path中新建子目录。其中，创建位置path可采用URI格式进行指定。该命令功能与Linux系统的mkdir相同，允许一次创建多个子目录。一般格式如下：

hadoop fs -mkdir [-p]

其中，-p选项表示创建子目录时先检查路径是否存在，若不存在则同时创建相应的各级目录。

(3) 查看test1是否创建成功

hdfs dfs -ls /

(4)在主目录下创建一个data.txt文件，填充文本（可自定）

（5）将data.txt的数据上传到HDFS的test1中

hdfs dfs -put ~data.txt /test1

再次使用 hdfs dfs -ls /检查数据是否传输成功

（6）运行WordCount程序

hadoop jar [hadoop-mapreduce-examples的地址].jar wordcount /test1/data.txt /test/out

可以试着按照截图中的路径找hadoop-mapreduce-examples的地址

（7）查看结果所在文件

从上图中知道生成了三个文件，我们的结果在"part-r-00000"中

（8）查看结果输出文件内容

hdfs dfs -cat /test/out/part-r-00000

HDFS dfs 操作命令

问题集锦

1)查看解决方法

2）输入文件缺少斜杆

博客等级

码龄5年

4
原创

3
点赞

22
收藏

0
粉丝

关注

私信

热门文章

上一篇：: 引用数据类型和基本数据类型的区别

下一篇：: Hadoop平台搭建

最新评论

Hadoop平台搭建
优快云-Ada助手: 恭喜您成功完成了Hadoop平台的搭建！这篇博客对于那些刚刚接触Hadoop的人来说，一定非常有帮助。接下来，我建议您可以进一步深入探讨Hadoop平台的应用场景，以及如何优化Hadoop集群的性能。期待看到您更多的精彩作品！优快云会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。