运行hadoop jar

最新推荐文章于 2024-08-25 03:47:52 发布

原创最新推荐文章于 2024-08-25 03:47:52 发布 · 183 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#hadoop

hadoop 专栏收录该内容

4 篇文章

订阅专栏

1.
拷贝文件，注意端口号
hadoop jar first-hadoop-0.0.1-SNAPSHOT.jar ch03.FileCopyWithProgress Hello.class hdfs://localhost:9000/user/a.txt
或
hadoop jar first-hadoop-0.0.1-SNAPSHOT.jar ch03.FileCopyWithProgress Hello.class /user/a.txt

2.
运行jar里的Hello
hadoop jar first-hadoop-0.0.1-SNAPSHOT.jar hello.Hello

3.结果

12/04/12 23:59:12 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same.
12/04/12 23:59:12 INFO mapred.FileInputFormat: Total input paths to process : 1
12/04/12 23:59:12 INFO mapred.JobClient: Running job: job_201204122244_0006
12/04/12 23:59:13 INFO mapred.JobClient: map 0% reduce 0%
12/04/12 23:59:28 INFO mapred.JobClient: map 100% reduce 0%
12/04/12 23:59:40 INFO mapred.JobClient: map 100% reduce 100%
12/04/12 23:59:45 INFO mapred.JobClient: Job complete: job_201204122244_0006
12/04/12 23:59:45 INFO mapred.JobClient: Counters: 30
12/04/12 23:59:45 INFO mapred.JobClient: Job Counters
12/04/12 23:59:45 INFO mapred.JobClient: Launched reduce tasks=1
12/04/12 23:59:45 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=18796
12/04/12 23:59:45 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0
12/04/12 23:59:45 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0
12/04/12 23:59:45 INFO mapred.JobClient: Launched map tasks=2
12/04/12 23:59:45 INFO mapred.JobClient: Data-local map tasks=2
12/04/12 23:59:45 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=10227
12/04/12 23:59:45 INFO mapred.JobClient: File Input Format Counters
12/04/12 23:59:45 INFO mapred.JobClient: Bytes Read=1996
12/04/12 23:59:45 INFO mapred.JobClient: File Output Format Counters
12/04/12 23:59:45 INFO mapred.JobClient: Bytes Written=506
12/04/12 23:59:45 INFO mapred.JobClient: FileSystemCounters
12/04/12 23:59:45 INFO mapred.JobClient: FILE_BYTES_READ=696
12/04/12 23:59:45 INFO mapred.JobClient: HDFS_BYTES_READ=2166
12/04/12 23:59:45 INFO mapred.JobClient: FILE_BYTES_WRITTEN=64709
12/04/12 23:59:45 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=506
12/04/12 23:59:45 INFO mapred.JobClient: Map-Reduce Framework
12/04/12 23:59:45 INFO mapred.JobClient: Map output materialized bytes=702
12/04/12 23:59:45 INFO mapred.JobClient: Map input records=23
12/04/12 23:59:45 INFO mapred.JobClient: Reduce shuffle bytes=702
12/04/12 23:59:45 INFO mapred.JobClient: Spilled Records=92
12/04/12 23:59:45 INFO mapred.JobClient: Map output bytes=598
12/04/12 23:59:45 INFO mapred.JobClient: Total committed heap usage (bytes)=337780736
12/04/12 23:59:45 INFO mapred.JobClient: CPU time spent (ms)=1480
12/04/12 23:59:45 INFO mapred.JobClient: Map input bytes=1330
12/04/12 23:59:45 INFO mapred.JobClient: SPLIT_RAW_BYTES=170
12/04/12 23:59:45 INFO mapred.JobClient: Combine input records=0
12/04/12 23:59:45 INFO mapred.JobClient: Reduce input records=46
12/04/12 23:59:45 INFO mapred.JobClient: Reduce input groups=2
12/04/12 23:59:45 INFO mapred.JobClient: Combine output records=0
12/04/12 23:59:45 INFO mapred.JobClient: Physical memory (bytes) snapshot=324440064
12/04/12 23:59:45 INFO mapred.JobClient: Reduce output records=46
12/04/12 23:59:45 INFO mapred.JobClient: Virtual memory (bytes) snapshot=1121619968
12/04/12 23:59:45 INFO mapred.JobClient: Map output records=46

4.获取结果文件
-getmerge <src> <localdst>

拷贝到本地
hadoop fs -getmerge hdfs://localhost:9000/user/c.txt c.txt
hadoop fs -getmerge /user/c.txt c.txt

直接查看
hadoop fs -cat /user/c.txt/part-00000

5.hadoop存储文件目录/tmp/hadoop-root/dfs/data/current