hadoop分布式的启动和wordcount实例

本文详细介绍了如何使用Hadoop搭建集群,并通过Wordcount实例演示了数据处理流程。主要内容包括:集群启动与验证步骤,常见启动失败问题及解决方法,以及成功启动后通过Web界面查看状态的方法。此外,还提供了Wordcount实例的具体操作步骤,从创建测试文件到运行程序并获取结果的全过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1:格式化namenode
 
  hadoop namenode -format

2:启动
   start-all.sh

3:验证
   jps
   查看当前hadoop进程
   正确启动后
   master
     namenode
     secondarynamenode
     tasktracker
     jps
   slave
     datanode
     jobtracker
     jps

4:启动不成功的问题(自己遇到的)
首先要关闭防火墙
第一个是namenode没有启动成功,原因是没有格式化namenode
解决方法:handoop namenode -format 格式化后重新start-all.sh
第二个是datanode没有启动成功,原因不太清楚,不过在网上找到了解决办法,类似于缓存一样的原因
解决办法:删除slave中的tmp目录,然后重新建立tmp目录
mkdir tmp
cd tmp
mkdir data
mkdir name

5:启动成功后可以登录网页查看
http://master:50030/jobtracker.jsp
http://master:50070      

6:wordcount实例
hadoop自带的实例hadoop-examples-1.1.2.jar里面包含Wordcount程序
创建两个文件test1.txt和test2.txt,内容分别问hello world和hello hadoop
hadoop fs -mkdir ./input
hadoop fs -mkdir ./out
hadoop fs -put test1.txt ./input
hadoop fs -put test2.txt ./input
hadoop jar hadoop-examples-1.1.2.jar Wordcount input out

hadoop fs -ls ./out

hadoop fs -cat ./out/*
可以看到结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值