Hive UDF 手册

官方 HiveUDF LanguageManual 点这里

关系运算

等值比较: =
语法:A = B
操作类型: 所有基本类型
描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE
举例:

hive> select 1 from dual where 1=1;
1

不等值比较: <>

语法: A <> B
操作类型: 所有基本类型
描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A与表达式B不相等,则为TRUE;否则为FALSE
举例:

hive> select 1 from dual where 1 <> 2;
1

小于比较: <

语法: A < B

操作类型: 所有基本类型

描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A小于表达式B,则为TRUE;否则为FALSE

举例:

hive> select 1 from dual where 1 < 2;
1

小于等于比较: <=

语法: A <= B

操作类型: 所有基本类型

描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A小于或者等于表达式B,则为TRUE;否则为FALSE

举例:

hive> select 1 from dual where 1 <= 1;
1

大于比较: >

语法: A > B
操作类型: 所有基本类型

描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A大于表达式B,则为TRUE;否则为FALSE

举例:

hive> select 1 from dual where 2 > 1;
1

大于等于比较: >=

语法: A >= B
操作类型: 所有基本类型
描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A大于或者等于表达式B,则为TRUE;否则为FALSE
举例:

hive> select 1 from dual where 1 >= 1;
1

String的比较要注意(常用的时间比较可以先to_date之后再比较)

hive> select  * from udftest;
OK
2011111209 00:00:00     2011111209
hive> select a,b,ab,a=b from udftest;
2011111209 00:00:00     2011111209      false   true    false

空值判断: IS NULL

语法: A IS NULL
操作类型: 所有类型
描述: 如果表达式A的值为NULL,则为TRUE;否则为FALSE
举例:

hive> select 1 from dual where null is null;
1

非空判断: IS NOT NULL

语法: A IS NOT NULL
操作类型: 所有类型
描述: 如果表达式A的值为NULL,则为FALSE;否则为TRUE
举例:

hive> select 1 from dual where 1 is not null;
1

LIKE比较: LIKE

语法: A LIKE B
操作类型: strings
描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合表达式B的正则语法,则为TRUE;否则为FALSE。B中字符”_”表示任意单个字符,而字符”%”表示任意数量的字符。
举例:

hive> select 1 from dual where ‘football’ like ‘foot%’;
1
hive> select 1 from dual where ‘football’ like ‘foot____’;
1

JAVA的LIKE操作: RLIKE

语法: A RLIKE B
操作类型: strings
描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合JAVA正则表达式B的正则语法,则为TRUE;否则为FALSE。
举例:

hive> select 1 from dual where ‘footbar’ rlike ‘^f.*r$’;
1

REGEXP操作: REGEXP

语法: A REGEXP B
操作类型: strings
描述: 功能与RLIKE相同
举例:

hive> select 1 from dual where ‘footbar’ REGEXP ‘^f.*r$’;
1

hive 数学运算

加法操作: +

语法: A + B
操作类型:所有数值类型
说明:返回A与B相加的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。比如,int + int 一般结果为int类型,而int + double 一般结果为double类型
举例:

hive> select 1 + 9 from dual;
10
hive> create table udftest as select 1 + 1.2 from dual;
hive> describe udftest;
_c0     double

减法操作: -

语法: A – B
操作类型:所有数值类型
说明:返回A与B相减的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。比如,int – int 一般结果为int类型,而int – double 一般结果为double类型
举例:

hive> select 105 from dual;
5
hive> create table udftest as select 5.64 from dual;
hive> describe udftest;
_c0     double

乘法操作: *

语法: A * B
操作类型:所有数值类型
说明:返回A与B相乘的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。注意,如果A乘以B的结果超过默认结果类型的数值范围,则需要通过cast将结果转换成范围更大的数值类型
举例:

hive> select 40 * 5 from dual;
200

除法操作: /

语法: A / B
操作类型:所有数值类型
说明:返回A除以B的结果。结果的数值类型为double
举例:

hive> select 40 / 5 from dual;
8.0

取余操作: %

语法: A % B
操作类型:所有数值类型
说明:返回A除以B的余数。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。
举例:

hive> select 41 % 5 from dual;
1
hive> select 8.4 % 4 from dual;
0.40000000000000036

注:精度在hive中是个很大的问题,类似这样的操作最好通过round指定精度

hive> select round(8.4 % 4 , 2) from dual;
0.4

位与操作: &

语法: A & B
操作类型:所有数值类型
说明:返回A和B按位进行与操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。
举例:

hive> select 4 & 8 from dual;
0
hive> select 6 & 4 from dual;
4

位或操作: |

语法: A | B
操作类型:所有数值类型
说明:返回A和B按位进行或操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。
举例:

hive> select 4 | 8 from dual;
12
hive> select 6 | 8 from dual;
14

位异或操作: ^

语法: A ^ B
操作类型:所有数值类型
说明:返回A和B按位进行异或操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。
举例:

hive> select 4 ^ 8 from dual;
12
hive> select 6 ^ 4 from dual;
2

位取反操作: ~

语法: ~A
操作类型:所有数值类型
说明:返回A按位取反操作的结果。结果的数值类型等于A的类型。
举例:

hive> select ~6 from dual;
-7
hive> select ~4 from dual;
-5

逻辑运算

逻辑与操作: AND

语法: A AND B
操作类型:boolean
说明:如果A和B均为TRUE,则为TRUE;否则为FALSE。如果A为NULL或B为NULL,则为NULL
举例:

hive> select 1 from dual where 1=1 and 2=2;
1

逻辑或操作: OR

语法: A OR B
操作类型:boolean
说明:如果A为TRUE,或者B为TRUE,或者A和B均为TRUE,则为TRUE;否则为FALSE
举例:

hive> select 1 from dual where 1=2 or 2=2;
1

逻辑非操作: NOT

语法: NOT A
操作类型:boolean
说明:如果A为FALSE,或者A为NULL,则为TRUE;否则为FALSE
举例:

hive> select 1 from dual where not 1=2;
1

HIVE UDF整理(四)

复合类型构建操作

Map类型构建: map

语法: map (key1, value1, key2, value2, …)
说明:根据输入的key和value对构建map类型
举例:

hive> Create table udftest as select map(’100′,’tom’,’200′,’mary’) as t from dual;
hive> describe udftest;
t       map
hive> select t from udftest;
{“100″:”tom”,”200″:”mary”}

Struct类型构建: struct

语法: struct(val1, val2, val3, …)
说明:根据输入的参数构建结构体struct类型
举例:

hive> create table udftest as select struct(‘tom’,'mary’,'tim’) as t from dual;
hive> describe udftest;
t       struct
hive> select t from udftest;
{“col1″:”tom”,”col2″:”mary”,”col3″:”tim”}

array类型构建: array

语法: array(val1, val2, …)
说明:根据输入的参数构建数组array类型
举例:

hive> create table udftest as select array(“tom”,”mary”,”tim”) as t from dual;
hive> describe udftest;
t       array
hive> select t from udftest;
["tom","mary","tim"]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值