目标:测试WordCount程序
当前定位于$hadoop_home目录.
1.将$hadoop_home/etc/core-site.xml上传到hdfs的/user/input下.
bin/hdfs dfs -appendToFile /usr/hadoop/hadoop-2.7.2/etc/hadoop/core-site.xml /user/input/core-site.xml
2.使用hadoop-mapreduce-example-2.7.2.jar包中的wordCount程序处理文件.
bin/hadoop jar hadoop-mapreduce-examples-2.7.2.jar wordcount /user/input /user/output
3.将/user/output/part-r-00000文件重定向到输出流.
bin/hdfs dfs -cat /user/output/part-r-00000
注意事项:
在hdfs中删除带文件目录, hdfs dfs -rm -r diretory
-appendToFile, 将本地文件复制到hdfs, 后面参数是文件不是目录.
-cat, 将文件重定向到标准输出流.
wordcount程序的输入输出目录都是在hdfs中.