目录
一、unix_timestamp函数用法-----将数据转化为时间戳形式
一、unix_timestamp函数用法-----将数据转化为时间戳形式
1、unix_timestamp() 得到当前时间戳
2、如果参数date满足yyyy-MM-dd HH:mm:ss形式,则可以直接unix_timestamp(string date) 得到参数对应的时间戳
3、如果参数date不满足yyyy-MM-dd HH:mm:ss形式,则我们需要指定date的形式,再进行转换
unix_timestamp(‘2009-03-20’, ‘yyyy-MM-dd’)=1237532400
【原文:https://blog.youkuaiyun.com/CZ626626/article/details/78333078 】
二、from_unixtime函数用法
语法:from_unixtime(t1,’yyyy-MM-dd HH:mm:ss’) --接受bigint形式的十位时间戳形式,返回规定的格式
其中t1是10位的时间戳值,即1970-1-1至今的秒,而13位的所谓毫秒的是不可以的。
对于13位时间戳,需要截取,然后转换成bigint类型,因为from_unixtime类第一个参数只接受bigint类型。
三、cast()函数-转换格式
CAST的语法为cast(value AS TYPE) 如果转换失败,CAST返回NULL
【链接:https://blog.youkuaiyun.com/HHTNAN/article/details/54572021】
【链接:https://blog.youkuaiyun.com/huangyinzhao/article/details/80754053】
四、正则替换
regexp_replace()
转载自过往记忆(https://www.iteblog.com/)
本文链接: 【Hive常用字符串函数】(https://www.iteblog.com/archives/1639.html)
五、row_number() over函数的用法
row_number() over (
order by xlh desc
) ----先把xlh 列降序排列,再为降序以后的每条xlh 记录返回一个序号。
row_number() over(
partition by
column1
order by
column2)
--表示根据COLUMN1 分组,在分组内部根据 COLUMN2排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的)
六、lateral view explode()函数用法
【链接:https://www.cnblogs.com/judylucky/p/3713774.html 】
【链接:https://my.oschina.net/u/3204727/blog/1571101 】
七、正则表达式的符号及意义
【链接:https://blog.youkuaiyun.com/xz1308579340/article/details/68061733 】
八、利用Grouping sets完成多维重组