Hive UDF、UDAF和UDTF函数
背景: Hive的自定义函数无法满足实际业务的需要,所以为了扩展性,Hive官方提供了自定义函数来实现需要的业务场景
1、定义
(1)udf(user defined function): 自定义函数,特点是输入一行,输出一行
(2)udaf(user defined aggregation function):自定义聚合函数,特点是输入多行,输出一行
(3)udtf(User-Defined Table-Generating Functions):自定义拆分函数,特点是输入一行,输出多行
2、使用
(1)UDF开发和使用步骤
创建函数流程
a、自定义一个Java类
b、继承UDF类
c、重写evaluate方法
d、打成jar包
e、在hive执行add jar方法 (临时使用)
f、在hive执行创建模板函数
g、hql中使用
&nb