
HQL打卡
文章平均质量分 72
分析复杂HQL的思路
超级通勤者
28岁的大龄大数据码农,持续更新大数据相关知识。
展开
-
Hive的时间函数
时间戳:s10位ms13位查看函数desc function xxx;日期 -> 时间戳unix_timestamp(“2020-10-28”, ‘yyyy-MM-dd’);Hive只认识以 “-” 划分的日期时间戳 -> 日期from_unixtime(1603843200);2020-10-28 00:00:00年、月、日select year(“2020-10-28 00:00:00”);select month(“原创 2021-05-19 12:00:02 · 123 阅读 · 0 评论 -
HQL打卡第2题
HQL打卡第2题需求1. 表格数据2. 最终结果3. 最终结果字段解释HQL 书写1. 计算出每一行的 DIFF_TS2. 当 DIFF_TS > 0 的时候,赋值为 1,否则赋值为 03. 对于每个用户,GROUP_ID 的编号是从第一行到该行所有标号为 1 的个数加 1最终 HQL 总结需求1. 表格数据user_idevent_tsA1566300034A1566300044A1566300050A1566300150A15663001原创 2021-05-19 11:59:04 · 120 阅读 · 0 评论 -
HQL打卡第1题: 统计每个员工的最高连续打卡次数
HQL每日打卡第1题需求1. 创建表格语句2. 表格数据3. 字段解释HQL书写1. 筛选出用户打卡的所有记录,即is_flag = 1 的所有记录2. 使用 Hive 的 rank() 函数,对每个用户 uid 的时间 tdate 分别进行排序3. 使用 date_sub(tdate, rk) 函数计算每一行 tdate 的前 rk 天的日期4. 对于同一个 uid, 相同的 sub_date_rk 出现的次数即为连续签到的次数5. 对于同一个 uid,会有多条相同sub_date_rk 次数的记录,要想原创 2021-05-08 15:13:04 · 477 阅读 · 0 评论