Hive常见的日期函数

hive中常见的几种日期函数的用法

1、fom_unixtime

UNIX 时间戳转日期
语法:fom_unixtime(bigint unixtime[, string format]);
返回类型:string

说明:转化 UNIX 时间戳(从1970-01-01 00:00:00 UTC 到指定时间的秒数)到当前时区的时间格式。

例如:select from_unixtime(1590000000, 'yyyy-MM-dd');
返回:2020-05-21

2、unix_timestamp

获取当前 UNIX 时间戳
语法1:不传参数
unix_timestamp()
返回类型:bigint

说明:获取当前时区的 UNIX 时间戳。可以和from_unixtime一起搭配使用

例如:select unix_timestamp();
返回:1592361030
结合from_unixtime:select from_unixtime(select unix_timestamp(), 'yyyy-MM-dd');
返回:2020-6-17

把日期转为UNIX 时间戳
语法2:传参数“yyyy-MM-dd HH:mm:ss”
unix_timestamp(string date)
返回类型:bigint

说明:转换格式为 “yyyy-MM-dd HH:mm:ss” 的日期到 UNIX 时间戳。日期必须包含时分秒,否则会转换失败,返回 NULL。

例如:select unix_timestamp('2020-06-17 01:01:00');
返回:1592326860

指定格式日期转 UNIX 时间戳
语法3:unix_timestamp(string date, string pattern)
返回类型:bigint

说明:转换 pattern 格式的日期为 UNIX 时间戳。这里要注意传的日期要和后面的格式一一对应,如果传的是年月日:‘20200521’,后面的格式要为:‘yyyyMMdd’。前后不一致会导致转换失败,如果转换失败,则返回 NULL。

例如:select unix_timestamp('20200521', 'yyyyMMdd');
返回:15989990400

3、日期时间转日期函数:to_date

语法:to_date(string timestamp)
返回类型:string

说明:返回日期时间字段中的日期部分。只能是“yyyy-MM-dd” 或 “yyyy-MM-dd HH:mm:ss”,其他格式会返回Null

例如:select to_date('2020-05-21 01:01:00');
返回:2020-05-21

4、日期转年函数:year

语法:year(string date)
返回类型:int

说明:返回日期中的年份。格式同to_date

例如:select year('2020-05-21 01:01:00');
返回:2020

5、日期转月函数:month

语法:month(string date)
返回类型:int

说明:返回日期中的月份。格式同to_date

例如:select month('2020-05-21 01:01:00');
返回:5

6、日期转天函数:day

语法:day(string date)
返回类型:int

说明:返回日期中的天。格式同to_date

例如:select day('2020-05-21 01:01:00');
返回:21

7、日期转小时函数:hour

语法:hour(string date)
返回类型:int

说明:返回日期中的小时。只能是“yyyy-MM-dd HH:mm:ss”,如果参数里没有时分秒会返回‘0’。(必须包含HH:mm:ss,少一个都会返回‘0’!)

例如:select hour('2020-05-21 01:01:10');
返回:1

8、日期转分钟函数:minute

语法:minute(string date)
返回类型:int

说明:返回日期中的分钟。格式同hour

例如:select minute('2020-05-21 01:01:10');
返回:40

9、日期转秒函数:second

语法:second(string date)
返回类型:int

说明:返回日期中的秒。格式同hour

例如:select second('2020-05-21 01:01:10');
返回:10

10、日期转周函数:weekofyear

语法:weekofyear(string date)
返回类型:int

说明:返回日期在该年的周数。格式同to_date

例如:select weekofyear('2020-05-21 01:01:10');
返回:21

11、日期比较函数:datediff

语法:datediff(string enddate, string startdate)
返回类型:int

说明:返回结束日期减去开始日期的天数。结束日期在前,开始日期在后,否则会返回负数。格式同to_date

例如:select datediff('2020-05-21', '2020-05-20');
返回:1

12、日期增加函数:date_add

语法:date_add(string startdate, int days)
返回类型:string

说明:返回日期 startdate 增加 days 天后的日期。int days也可以传负数,为负数时就是减去days天后的日期

例如:select date_add('2020-05-21', 10);
返回:2020-05-31

13、日期减少函数:date_sub

语法:date_sub(string startdate, int days)
返回类型:string

说明:返回开始日期 startdate 减少 days 天后的日期。同date_add

例如:select date_sub('2020-05-21', 10);
返回:2020-05-11
关于其中的组合用法,大家可以自己去探索。

### Hive 日期函数与字符串拼接的综合使用 在 Hive 中,日期函数和字符串拼接可以结合起来完成复杂的查询需求。以下是关于 Hive日期函数以及如何将其结果与其他字段通过字符串拼接的方式组合使用的说明。 #### 1. 常见Hive 日期函数 Hive 提供了一系列强大的日期处理函数来满足不同的业务需求。常用的日期函数包括但不限于以下几种: - **from_unixtime(unix_time)** 将 Unix 时间戳转换为指定格式的时间字符串[^2]。例如:`from_unixtime(1672531200, 'yyyy-MM-dd')` 返回 `'2023-01-01'`。 - **unix_timestamp(date_string, format)** 将给定时间字符串按照指定格式解析并返回对应的 Unix 时间戳[^2]。例如:`unix_timestamp('2023-01-01', 'yyyy-MM-dd')` 返回 `1672531200`。 - **date_add(start_date, num_days)** 和 **date_sub(start_date, num_days)** 对某个起始日期增加或减少天数[^2]。例如:`date_add('2023-01-01', 1)` 返回 `'2023-01-02'`;而 `date_sub('2023-01-01', 1)` 则返回 `'2022-12-31'`。 - **datediff(end_date, start_date)** 计算两个日期之间的差值(单位为天)[^2]。例如:`datediff('2023-01-02', '2023-01-01')` 返回 `1`。 --- #### 2. 字符串拼接方法回顾 Hive 支持多种字符串拼接方式,具体如下: - **CONCAT 函数** 只能用于简单的字符串连接操作,不支持自定义分隔符[^1]。例如:`CONCAT('abc', '-', 'def')` 返回 `'abcdef-'`。 - **CONCAT_WS 函数** 使用指定的分隔符将多个字符串连接起来[^2]。例如:`CONCAT_WS('-', 'abc', 'def')` 返回 `'abc-def'`。 - **|| 运算符** 是一种更简洁的字符串拼接方式,适用于基本场景下的字符串连接[^3]。需要注意的是,如果其中一方不是字符串,则需要显式转换为其类型[^4]。例如:`SELECT 'Hello' || ' World';` 返回 `'Hello World'`。 --- #### 3. 综合示例:日期函数与字符串拼接结合 下面是一个具体的例子,展示如何利用 Hive日期函数和字符串拼接技术生成新的字段。 假设有一张表 `orders`,结构如下: | order_id | customer_name | order_date | |----------|---------------|------------------| | 1 | Alice | 2023-01-01 | | 2 | Bob | 2023-01-02 | 目标是创建一个新的字段,显示客户的姓名及其订单日期加一天后的信息。 ```sql SELECT customer_name, date_add(order_date, 1) AS next_day_order_date, CONCAT(customer_name, ': Next day is ', date_add(order_date, 1)) AS info_with_concat, CONCAT_WS(' -> ', customer_name, date_add(order_date, 1)) AS info_with_concat_ws FROM orders; ``` 运行以上 SQL 后的结果可能如下所示: | customer_name | next_day_order_date | info_with_concat | info_with_concat_ws | |--------------|----------------------|-------------------------------------|------------------------------| | Alice | 2023-01-02 | Alice: Next day is 2023-01-02 | Alice -> 2023-01-02 | | Bob | 2023-01-03 | Bob: Next day is 2023-01-03 | Bob -> 2023-01-03 | 此示例展示了如何灵活运用 Hive日期函数和字符串拼接功能构建复杂的数据视图。 --- #### 4. 注意事项 - 如果涉及跨类型的运算(如整数与字符串),需先进行类型转换再执行拼接操作。 - 当数据集中存在 NULL 值时,建议提前对其进行填充或者过滤,以免影响最终结果[^5]。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值