Hive UDF 手册

最新推荐文章于 2025-05-20 13:17:17 发布

翻译最新推荐文章于 2025-05-20 13:17:17 发布 · 1.3k 阅读

文章标签：

#Hive #UDF #Hadoop

Hadoop 专栏收录该内容

14 篇文章

订阅专栏

官方 HiveUDF LanguageManual 点这里

关系运算

等值比较: =
语法:A = B
操作类型: 所有基本类型
描述: 如果表达式A与表达式B相等，则为TRUE；否则为FALSE
举例：

hive> select 1 from dual where 1=1;
1

不等值比较: <>

语法: A <> B
操作类型: 所有基本类型
描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A与表达式B不相等，则为TRUE；否则为FALSE
举例：

hive> select 1 from dual where 1 <> 2;
1

小于比较: <

语法: A < B

操作类型: 所有基本类型

描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A小于表达式B，则为TRUE；否则为FALSE

举例：

hive> select 1 from dual where 1 < 2;
1

小于等于比较: <=

语法: A <= B

操作类型: 所有基本类型

描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A小于或者等于表达式B，则为TRUE；否则为FALSE

举例：

hive> select 1 from dual where 1 <= 1;
1

大于比较: >

语法: A > B
操作类型: 所有基本类型

描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A大于表达式B，则为TRUE；否则为FALSE

举例：

hive> select 1 from dual where 2 > 1;
1

大于等于比较: >=

语法: A >= B
操作类型: 所有基本类型
描述: 如果表达式A为NULL，或者表达式B为NULL，返回NULL；如果表达式A大于或者等于表达式B，则为TRUE；否则为FALSE
举例：

hive> select 1 from dual where 1 >= 1;
1

String的比较要注意(常用的时间比较可以先to_date之后再比较)

hive> select  * from udftest;
OK
2011111209 00:00:00     2011111209
hive> select a,b,ab,a=b from udftest;
2011111209 00:00:00     2011111209      false   true    false

空值判断: IS NULL

语法: A IS NULL
操作类型: 所有类型
描述: 如果表达式A的值为NULL，则为TRUE；否则为FALSE
举例：

hive> select 1 from dual where null is null;
1

非空判断: IS NOT NULL

语法: A IS NOT NULL
操作类型: 所有类型
描述: 如果表达式A的值为NULL，则为FALSE；否则为TRUE
举例：

hive> select 1 from dual where 1 is not null;
1

LIKE比较: LIKE

语法: A LIKE B
操作类型: strings
描述: 如果字符串A或者字符串B为NULL，则返回NULL；如果字符串A符合表达式B的正则语法，则为TRUE；否则为FALSE。B中字符”_”表示任意单个字符，而字符”%”表示任意数量的字符。
举例：

hive> select 1 from dual where ‘football’ like ‘foot%’;
1
hive> select 1 from dual where ‘football’ like ‘foot____’;
1

JAVA的LIKE操作: RLIKE

语法: A RLIKE B
操作类型: strings
描述: 如果字符串A或者字符串B为NULL，则返回NULL；如果字符串A符合JAVA正则表达式B的正则语法，则为TRUE；否则为FALSE。
举例：

hive> select 1 from dual where ‘footbar’ rlike ‘^f.*r$’;
1

REGEXP操作: REGEXP

语法: A REGEXP B
操作类型: strings
描述: 功能与RLIKE相同
举例：

hive> select 1 from dual where ‘footbar’ REGEXP ‘^f.*r$’;
1

hive 数学运算

加法操作: +

语法: A + B
操作类型：所有数值类型
说明：返回A与B相加的结果。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。比如，int + int 一般结果为int类型，而int + double 一般结果为double类型
举例：

hive> select 1 + 9 from dual;
10
hive> create table udftest as select 1 + 1.2 from dual;
hive> describe udftest;
_c0     double

减法操作: -

语法: A – B
操作类型：所有数值类型
说明：返回A与B相减的结果。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。比如，int – int 一般结果为int类型，而int – double 一般结果为double类型
举例：

hive> select 10 – 5 from dual;
5
hive> create table udftest as select 5.6 – 4 from dual;
hive> describe udftest;
_c0     double

乘法操作: *

语法: A * B
操作类型：所有数值类型
说明：返回A与B相乘的结果。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。注意，如果A乘以B的结果超过默认结果类型的数值范围，则需要通过cast将结果转换成范围更大的数值类型
举例：

hive> select 40 * 5 from dual;
200

除法操作: /

语法: A / B
操作类型：所有数值类型
说明：返回A除以B的结果。结果的数值类型为double
举例：

hive> select 40 / 5 from dual;
8.0

取余操作: %

语法: A % B
操作类型：所有数值类型
说明：返回A除以B的余数。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。
举例：

hive> select 41 % 5 from dual;
1
hive> select 8.4 % 4 from dual;
0.40000000000000036

注：精度在hive中是个很大的问题，类似这样的操作最好通过round指定精度

hive> select round(8.4 % 4 , 2) from dual;
0.4

位与操作: &

语法: A & B
操作类型：所有数值类型
说明：返回A和B按位进行与操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。
举例：

hive> select 4 & 8 from dual;
0
hive> select 6 & 4 from dual;
4

位或操作: |

语法: A | B
操作类型：所有数值类型
说明：返回A和B按位进行或操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。
举例：

hive> select 4 | 8 from dual;
12
hive> select 6 | 8 from dual;
14

位异或操作: ^

语法: A ^ B
操作类型：所有数值类型
说明：返回A和B按位进行异或操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型（详见数据类型的继承关系）。
举例：

hive> select 4 ^ 8 from dual;
12
hive> select 6 ^ 4 from dual;
2

位取反操作: ~

语法: ~A
操作类型：所有数值类型
说明：返回A按位取反操作的结果。结果的数值类型等于A的类型。
举例：

hive> select ~6 from dual;
-7
hive> select ~4 from dual;
-5

逻辑运算

逻辑与操作: AND

语法: A AND B
操作类型：boolean
说明：如果A和B均为TRUE，则为TRUE；否则为FALSE。如果A为NULL或B为NULL，则为NULL
举例：

hive> select 1 from dual where 1=1 and 2=2;
1

逻辑或操作: OR

语法: A OR B
操作类型：boolean
说明：如果A为TRUE，或者B为TRUE，或者A和B均为TRUE，则为TRUE；否则为FALSE
举例：

hive> select 1 from dual where 1=2 or 2=2;
1

逻辑非操作: NOT

语法: NOT A
操作类型：boolean
说明：如果A为FALSE，或者A为NULL，则为TRUE；否则为FALSE
举例：

hive> select 1 from dual where not 1=2;
1

HIVE UDF整理（四）

复合类型构建操作

Map类型构建: map

语法: map (key1, value1, key2, value2, …)
说明：根据输入的key和value对构建map类型
举例：

hive> Create table udftest as select map(’100′,’tom’,’200′,’mary’) as t from dual;
hive> describe udftest;
t       map
hive> select t from udftest;
{“100″:”tom”,”200″:”mary”}

Struct类型构建: struct

语法: struct(val1, val2, val3, …)
说明：根据输入的参数构建结构体struct类型
举例：

hive> create table udftest as select struct(‘tom’,'mary’,'tim’) as t from dual;
hive> describe udftest;
t       struct
hive> select t from udftest;
{“col1″:”tom”,”col2″:”mary”,”col3″:”tim”}

array类型构建: array

语法: array(val1, val2, …)
说明：根据输入的参数构建数组array类型
举例：

hive> create table udftest as select array(“tom”,”mary”,”tim”) as t from dual;
hive> describe udftest;
t       array
hive> select t from udftest;
["tom","mary","tim"]