hadoop-wordcount实验
初次使用hadooop感觉还可以,加油!废话不写,主要问题点如下:
1,初始检查hadoop平台的正常,
hadoop@hadoop001:~/hadoop$ jps
7727 ResourceManager
7967 NodeManager
7552 SecondaryNameNode
9917 Jps
7016 NameNode
7248 DataNode
过程中出现DataNode 节点没拉起,查看log后百度,发现自己多次格式化namenode造成的,namenode的clusterID和datanode的clusterid不一致导致的,解决办法:删除data的文件夹,后重新格式化。有人说换可以直接该动datanode的clusterid使之和namenode的clusterid一致,不过我没试验。
2,接下来就是打文件导入dfs中,然后编译后使用指令./bin/hadoop jar /tmp/hadoop-examples-1.2.0.jar wordcount /input /out
(有的路径格式不一样)
参考博客:http://blog.youkuaiyun.com/twlkyao/article/details/17382449
3结果:
hadoop@hadoop001:~$ cat part-r-00000
:wq 1
WordCount 1
count 2
guo 3
guoshuai 1
long 8
zhao 2
zhaozhaozhao 1
4,自己缺少代码的练习,自己--小白鼠。