运行hadoop自带的案例—wordcount

Hadoop WordCount 教程：从数据上传到结果查看

最新推荐文章于 2024-06-07 19:41:02 发布

原创最新推荐文章于 2024-06-07 19:41:02 发布 · 1.2k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#hadoop #文件系统 #分布式 #hdfs

hadoop 专栏收录该内容

11 篇文章

订阅专栏

本文详细介绍了如何使用Hadoop进行WordCount操作，包括创建目录、上传数据、运行WordCount例子及查看结果的完整流程。通过实际操作，帮助开发者理解和掌握Hadoop的基本用法。

主要有四个步骤：

一、在hdfs分布式文件系统中创建两个文件夹，分别存放输入、输出数据

1、 bin/hadoop fs –mkdir –p/data/wordcount 创建的输入数据目录

2、 bin/hadoop fs –mkdir –p/output/ 创建的输出数据目录

二、将要测试的文件上传到hdfs文件系统的输入数据目录

1、从本地上传到HDFS中

bin/hadoop fs –put 本地文件路径 HDFS系统输入数据路径

2、查看上传到hdfs中的文件情况：

bin/hadoop fs –ls /data/wordcount

3、查看上传到HDFS中的文件：

bin/hadoop fs –text /data/wordcount/

三、运行wordcount例子（运行jar包）

Bin/hadoop jar 本地文件jar包的路径 wordcount 输入数据在HDFS文件系统中的路径输出数据在HDFS文件系统中的路径

四、查看结果

bin/hadoop fs –text /output/wordcount/part–r-00000

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

cxx_317

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Hadoop之MapReduce01【自带wordcount案例】

2401_86430062的博客

07-22

1077

这些 MapReduce程序的代码都在hadoop-mapreduce-examples-2.6.4.jar包里,这个jar包在 hadoop安装目录下的/share/hadoop/mapreduce/目录里。引入 MapReduce 框架后，开发人员可以将绝大部分工作集中在业务逻辑的开发上，而将 分布式计算中的复杂性交由框架来处理。而一旦将单机版程序扩展到集群来分布式运行，将极大增加程序的复杂度和开发难度。在hdfs中创建文件夹存储需要统计的文件，及创建输出文件的路径。要做分布式运算必须要启动yarn。

大数据：Hadoop入门案例，命令行wordcount统计(1)

2401_84123171的博客

04-19

1083

学完之后，若是想验收效果如何，其实最好的方法就是可自己去总结一下。比如我就会在学习完一个东西之后自己去手绘一份xmind文件的知识梳理大纲脑图，这样也可方便后续的复习，且都是自己的理解，相信随便瞟几眼就能迅速过完整个知识，脑补回来。下方即为我手绘的Android框架体系架构知识脑图，由于是xmind文件，不好上传，所以小编将其以图片形式导出来传在此处，细节方面不是特别清晰。但可给感兴趣的朋友提供完整的Android框架体系架构知识脑图原件（包括上方的面试解析xmind文档）

1 条评论您还未登录，请先登录后发表或查看评论

hadoop自带示例wordcount

热门推荐

侠客小虎的博客

01-17

2万+

1.首先确认你的hadoop启动了。 master与slave启动方式相同，进入hadoop目录下的sbin目录，命令:$cd /home/hadoop/hadoop/sbin (根据个人安装的hadoop目录调整) 启动hadoop：(1)$./start-dfs.sh (2)$./start-yarn.sh 启动后的效果如图：master如图1，slave如图2 图1 图2

hadoop 自带示例

weixin_43411977的博客

07-18

908

查看hadoop有哪些自带的例子： $ hadoop jar /home/doop/hadoop/sahre/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.5.jar

执行hadoop 自带的例子

06-03

399

运行hadoop自带的word count小案例

浅陌夏初。的博客

10-08

3721

1. 创建一个文件上传目录 1）首先进入到hadoop文件夹下（命令：cd /usr/local/hadoop）； 2）创建目录“/test/wordcount”，用来存放hadoop自带的wordcount例子的数据文件。 bin/hadoop fs -mkdir -p /test/wordcount （创建上传文件目录） bin/hadoop fs -ls / （查看创建...

基于Hadoop集群实现wordcount案例

weixin_44999258的博客

01-22

2197

之前是在linux云服务器上的hadoop本地模式实现了wordcount案例：linux云服务器实现wordcount案例这次改用hadoop的集群模式实现此案例。首先需要确保已完成了Pseudo-Distributed Operation伪分布式搭建，如果没有完成，可参考linux云服务器实现hadoop的Pseudo-Distributed Operation伪分布式搭建搭建完成，并执行sbin/start-dfs.sh后，通过jps命令可查看已存在如下进程 31254 DataNode 3

Docker部署hadoop+运行wordcount详解

A18937260063的博客

06-07

2895

Docker部署hadoop+运行wordcount详解

hadoop的小例子,hadoop的小例子

10-24

小例子是自己写的，目的是让自己熟悉一下如何在集群上运行一个mapreduce项目，大家可以参考此例子学习hadoop，对入门很有帮助。小例子是自己写的，目的是让自己熟悉一下如何在集群上运行一个mapreduce项目，大家可以参考此例子学习hadoop，对入门很有帮助

hadoop几个实例

07-28

网上很难找的hadoop代码，很适合初学或想从事大数据方向的程序猿，心动者赶紧下载。

运行Hadoop自带的wordcount单词统计程序

weixin_33939843的博客

09-03

806

0.前言前面一篇《Hadoop初体验：快速搭建Hadoop伪分布式环境》搭建了一个Hadoop的环境，现在就使用Hadoop自带的wordcount程序来做单词统计的案例。1.使用示例程序实现单词统计（1）wordcount程序 wordcount程序在hadoop的share目录下，如下：[root@leaf mapreduce]# pwd /usr/local/hadoop/sh...

运行Hadoop自带的MapReduce程序WordCount

qq_40059532的博客

12-11

3968

Hadoop自带了个单词计数的MapReduce程序WordCount，下面用三种方法运行该程序在开始前先在hdfs上面创建输入和输出路径： 1、使用hdfs dfs -mkdir /input命令创建一个input文件夹 2、使用hdfs dfs -put /home/kingssm/input/data.dat /input命令将需要执行的文件上传到hdfs上的输入文件夹 3、使用hdfs ...

CentOS6.8下Hadoop2.7.2怎么运行自带的wordcount程序

sophiaFXR的博客

07-05

2620

CentOS6.8下Hadoop2.7.2怎么运行自带的wordcount程序 1 准备工作 1.1 创建输入输出路径首先在hdfs中创建数据目录，用来指定运行wordcount程序的输入输出路径。Hadoop命令在hadoop文件夹下的bin目录下，可通过如下命令查看：命令：ll /usr/local/hadoop/bin 查看结果如图1所示：图1 查找hadoop

hadoop运行workcount_hadoop：如何运行自带wordcount

weixin_26963033的博客

01-27

1291

hadoop：如何运行自带wordcount转载自：http://www.aboutyun.com/thread-7713-1-1.html1.找到examples例子我们需要找打这个例子的位置：首先需要找到你的hadoop文件夹，然后依照下面路径：/hadoop/share/hadoop/mapreduce会看到如下图：hadoop-mapreduce-examples-2.2.0.jar第二...

Hadoop之运行wordcount

https://gitcode.net/liuyuan185442111

01-19

754

单词计数是最简单也是最能体现MapReduce思想的程序之一，可以称为MapReduce版"Hello World"。

手把手教你使用Hadoop自带的wordcount程序

qq_43008103的博客

07-13

6567

切换到hadoop用户，启动Hadoop su hadoop start-all.sh mr-jobhistory-daemon.sh start historyserver

hadoop运行案例

weixin_30312557的博客

04-09

151

运行一个example [hadoop@hadoop01 hadoop]$ hadoop jar ./share/hadoop/mapreduce2/hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar pi 5 10 运行的过程中报错然后去查看jobhistory 发现以下错误 Error: java.lang.RuntimeException: ...

linux hadoop自带的wordcount测试