背景
Hive 有丰富的内置函数,方便数据处理和数据分析。但是有些时候无法满足需求,这时就需要自定义函数(User-Defined Functions , UDF)来扩展 Hive 函数库,实现用户想要的功能。
UDF 开发
编写 UDF 函数需要下面两个步骤:
- 继承 org.apache.hadoop.hive.ql.exec.UDF
- 实现 evaluate 函数,这个函数必须要有返回值,不能设置为void。
样例:
1、导入依赖
<dependencies>
<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-exec</artifactId>
<version>3.1.2</version>
</dependency&g