hadoop作业引用第三方jar文件

最新推荐文章于 2021-02-23 15:49:43 发布

原创

最新推荐文章于 2021-02-23 15:49:43 发布 · 1.1w 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#hadoop #jar #作业 #mapreduce #path

本文介绍了在Hadoop中执行MapReduce作业时如何处理引用第三方jar文件的问题。当通过命令行执行jar文件时，可能会遇到ClassNotFoundException。解决方法包括通过命令行参数、配置conf、使用分布式缓存以及将jar文件与程序打包在一起。同时，文章提到了JobTracker和TaskTracker如何获取这些jar文件的过程。

在eclipse中写mapreduce程序, 引用第三方jar文件, 可以利用eclipse hadoop插件直接run on hadoop提交, 很方便. 不过插件版本要和eclipse匹配, 不然总是local执行, 在50070是没有job产生的.

如果希望将程序发布成jar文件, 在namenode上通过命令行方式执行, 缺少了eclipse帮忙自动配置jar文件, 会遇到java.lang.ClassNotFoundException, 这个问题可分成两种情况讨论.

一. hadoop命令式如何执行的？

其实$HADOOP_HOME/bin/hadoop是一个脚本文件. 以下wordcount命令为例

bin/hadoop jar wordcount.jar myorg.WordCount /usr/wordcount/input /usr/wordcount/output

脚本文件解析参数, 配置类路径等, 最终执行的是如下命令:

exec java -classpath $CLASSPATH org.apache.hadoop.util.RunJar $@

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。