- 博客(5)
- 收藏
- 关注
原创 滴滴SQL真题整理
2023年1月1日完成首单的新司机的首单后的首周完单留存率(首单后的第一至第七天有完单行为),单个司机平均的7日及30日订单总金额ARPU(ARPU从首单当日算起,平均计算包括位留存的司机)找到2021年10月有过取消订单记录的司机,计算他们每人全部已完成的有评分订单的平均评分及总体平均评分,保留1位小数。先按driver_id升序输出,再输出总体情况。请统计2021年国庆7天期间在北京接单至少3次的司机的平均接单数和平均兼职收入(暂不考虑平台佣金,直接计算完成的订单费用总额),结果保留三位小数。
2024-09-07 12:39:00
2164
原创 HIVE SQL 高频(持续更新)
函数,有两个作用,第一个是去重,去除 group by 后的重复元素,第二个是形成一个集合,将 group by 后属于同一组的集合起来成为一个集合。lag 和 lead 有三个参数,第一个参数是列名,第二个参数是偏移量,第三个参数是超出记录窗口时的默认值。dense_rank()排序相同时会重复,总数会减少,即会出现1、1、2这样的排序结果;:找到最近一次没有签到的日期,那么在这之后的所有天数都可以被视为连续签到的天数。rank()排序相同时会重复,总数不变,即会出现1、1、3这样的排序结果;
2024-08-25 23:18:54
1014
原创 HIVE SQL进阶
table_temp 是因为 LATERAL VIEW UDTF 函数在执行时,会生成一个临时的虚拟表。lateral view:把拆分的单个字段数据与原始表的数据关联上。同时生成的列也需要列名col_name。eg.如何把table1变成table2。
2024-08-25 13:37:06
417
原创 Hive SQL的坑和note
但是如果我们使用的目的仅仅时简化sql比如 有时候查询指定的字段 select a,b,c,d,e,f,g,h from t 这种比较简单的查询还是推荐with tmp as ()语法,因为hive本身查询这种就很快,不需要额外花费时间落地为数据 这样还更耗时。
2024-07-23 20:53:44
1714
原创 SQL note
分别查看&结果不去重:所以直接使用两个条件的or是不行的,直接用union会去重,要用union all,分别去查满足条件1的和满足条件2的,然后合在一起不去重。语法:group_concat( [distinct] 要连接的字段 [order by 排序字段 asc/desc ] [separator '分隔符'] )如果给定两个参数,第一个参数指定第一个返回记录行的偏移量,第二个参数指定返回记录行的最大数目。[ ]:匹配[ ]中的任意一个字符(若要比较的字符是连续的,则可以用连字符“-”表 达 );
2024-07-14 16:36:30
1334
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅