hive中add jar运行报错

最新推荐文章于 2023-04-03 21:43:27 发布

原创最新推荐文章于 2023-04-03 21:43:27 发布 · 7.3k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#hive #udf

大数据相关同时被 2 个专栏收录

8 篇文章

订阅专栏

Debug

4 篇文章

订阅专栏

本文介绍了在Hive中部署自定义UDF函数时遇到的问题及解决方法。当尝试加载本地编译好的jar包到Hive时，由于路径错误导致无法正确加载。通过修改Hadoop的mapred-site.xml配置文件，添加了对YARN的支持后，问题得以解决。

问题：

在自己写好udf函数，编译成jar包，在hive命令行下执行，
add jar udfs-1.0-SNAPSHOT.jar; CREATE TEMPORARY FUNCTION strlen AS 'com.pingan.pbear.udf.StrLen'; select name, strlen(name), score from stu order by score;

上述代码涉及到order函数，hive会生成MR任务执行，报错信息如下：
`Total jobs = 1
Launching Job 1 out of 1
Number of reduce tasks determined at compile time: 1
In order to change the average load for a reducer (in bytes):
set hive.exec.reducers.bytes.per.reducer=
In order to limit the maximum number of reducers:
set hive.exec.reducers.max=
In order to set a constant number of reducers:
set mapreduce.job.reduces=
java.io.FileNotFoundException: File does not exist: hdfs://localhost:9000/Users/lovelife/git/pbear-offline/news/udfs/target/udfs-1.0-SNAPSHOT.jar
at org.apache.hadoop.hdfs.DistributedFileSystem$18.doCall(DistributedFileSystem.java:1122)

Job Submission failed with exception ‘java.io.FileNotFoundException(File does not exist: hdfs://localhost:9000/Users/lovelife/git/pbear-offline/news/udfs/target/udfs-1.0-SNAPSHOT.jar)’
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
如运行简单的命令则不会报错，比如select name, strlen(name), score from stu`

解决方案：
在hadoop中修改mapred-site.xml配置文件，加上如下内容：
<property> <name>mapreduce.framework.name</name> <value>yarn</value> </property>
名称mapreduce.framework.name指的是使用yarn运行mapreduce程序