Q010910-优快云博客

原创滴滴SQL真题整理

2023年1月1日完成首单的新司机的首单后的首周完单留存率（首单后的第一至第七天有完单行为），单个司机平均的7日及30日订单总金额ARPU（ARPU从首单当日算起，平均计算包括位留存的司机）找到2021年10月有过取消订单记录的司机，计算他们每人全部已完成的有评分订单的平均评分及总体平均评分，保留1位小数。先按driver_id升序输出，再输出总体情况。请统计2021年国庆7天期间在北京接单至少3次的司机的平均接单数和平均兼职收入（暂不考虑平台佣金，直接计算完成的订单费用总额），结果保留三位小数。

2024-09-07 12:39:00 2164

原创 HIVE SQL 高频（持续更新）

函数，有两个作用，第一个是去重，去除 group by 后的重复元素，第二个是形成一个集合，将 group by 后属于同一组的集合起来成为一个集合。lag 和 lead 有三个参数，第一个参数是列名，第二个参数是偏移量，第三个参数是超出记录窗口时的默认值。dense_rank()排序相同时会重复，总数会减少，即会出现1、1、2这样的排序结果；：找到最近一次没有签到的日期，那么在这之后的所有天数都可以被视为连续签到的天数。rank()排序相同时会重复，总数不变，即会出现1、1、3这样的排序结果；

2024-08-25 23:18:54 1014

原创 HIVE SQL进阶

table_temp 是因为 LATERAL VIEW UDTF 函数在执行时，会生成一个临时的虚拟表。lateral view：把拆分的单个字段数据与原始表的数据关联上。同时生成的列也需要列名col_name。eg.如何把table1变成table2。

2024-08-25 13:37:06 417

原创 Hive SQL的坑和note

但是如果我们使用的目的仅仅时简化sql比如有时候查询指定的字段 select a,b,c,d,e,f,g,h from t 这种比较简单的查询还是推荐with tmp as ()语法，因为hive本身查询这种就很快，不需要额外花费时间落地为数据这样还更耗时。

2024-07-23 20:53:44 1714

原创 SQL note

分别查看&结果不去重：所以直接使用两个条件的or是不行的，直接用union会去重，要用union all，分别去查满足条件1的和满足条件2的，然后合在一起不去重。语法：group_concat( [distinct] 要连接的字段 [order by 排序字段 asc/desc ] [separator '分隔符'] )如果给定两个参数，第一个参数指定第一个返回记录行的偏移量，第二个参数指定返回记录行的最大数目。[ ]：匹配[ ]中的任意一个字符(若要比较的字符是连续的，则可以用连字符“-”表达 )；

2024-07-14 16:36:30 1334

Credit Risk Fraud Detection

2024-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 滴滴SQL真题整理