主要有四个步骤:
一、 在hdfs分布式文件系统 中创建两个文件夹,分别存放输入、输出数据
1、 bin/hadoop fs –mkdir –p/data/wordcount 创建的输入数据目录
2、 bin/hadoop fs –mkdir –p/output/ 创建的输出数据目录
二、 将要测试的文件上传到hdfs文件系统的输入数据目录
1、 从本地上传到HDFS中
bin/hadoop fs –put 本地文件路径 HDFS系统输入数据路径
2、 查看上传到hdfs中的文件情况:
bin/hadoop fs –ls /data/wordcount
3、 查看上传到HDFS中的文件:
bin/hadoop fs –text /data/wordcount/
三、 运行wordcount例子(运行jar包)
Bin/hadoop jar 本地文件jar包的路径 wordcount 输入数据在HDFS文件系统中的路径 输出数据在HDFS文件系统中的路径
四、 查看结果
bin/hadoop fs –text /output/wordcount/part–r-00000
Hadoop WordCount 教程:从数据上传到结果查看
本文详细介绍了如何使用Hadoop进行WordCount操作,包括创建目录、上传数据、运行WordCount例子及查看结果的完整流程。通过实际操作,帮助开发者理解和掌握Hadoop的基本用法。
1077

被折叠的 条评论
为什么被折叠?



