自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 滴滴SQL真题整理

2023年1月1日完成首单的新司机的首单后的首周完单留存率(首单后的第一至第七天有完单行为),单个司机平均的7日及30日订单总金额ARPU(ARPU从首单当日算起,平均计算包括位留存的司机)找到2021年10月有过取消订单记录的司机,计算他们每人全部已完成的有评分订单的平均评分及总体平均评分,保留1位小数。先按driver_id升序输出,再输出总体情况。请统计2021年国庆7天期间在北京接单至少3次的司机的平均接单数和平均兼职收入(暂不考虑平台佣金,直接计算完成的订单费用总额),结果保留三位小数。

2024-09-07 12:39:00 2164

原创 HIVE SQL 高频(持续更新)

函数,有两个作用,第一个是去重,去除 group by 后的重复元素,第二个是形成一个集合,将 group by 后属于同一组的集合起来成为一个集合。lag 和 lead 有三个参数,第一个参数是列名,第二个参数是偏移量,第三个参数是超出记录窗口时的默认值。dense_rank()排序相同时会重复,总数会减少,即会出现1、1、2这样的排序结果;:找到最近一次没有签到的日期,那么在这之后的所有天数都可以被视为连续签到的天数。rank()排序相同时会重复,总数不变,即会出现1、1、3这样的排序结果;

2024-08-25 23:18:54 1014

原创 HIVE SQL进阶

table_temp 是因为 LATERAL VIEW UDTF 函数在执行时,会生成一个临时的虚拟表。lateral view:把拆分的单个字段数据与原始表的数据关联上。同时生成的列也需要列名col_name。eg.如何把table1变成table2。

2024-08-25 13:37:06 417

原创 Hive SQL的坑和note

但是如果我们使用的目的仅仅时简化sql比如 有时候查询指定的字段 select a,b,c,d,e,f,g,h from t 这种比较简单的查询还是推荐with tmp as ()语法,因为hive本身查询这种就很快,不需要额外花费时间落地为数据 这样还更耗时。

2024-07-23 20:53:44 1714

原创 SQL note

分别查看&结果不去重:所以直接使用两个条件的or是不行的,直接用union会去重,要用union all,分别去查满足条件1的和满足条件2的,然后合在一起不去重。语法:group_concat( [distinct] 要连接的字段 [order by 排序字段 asc/desc ] [separator '分隔符'] )如果给定两个参数,第一个参数指定第一个返回记录行的偏移量,第二个参数指定返回记录行的最大数目。[ ]:匹配[ ]中的任意一个字符(若要比较的字符是连续的,则可以用连字符“-”表 达 );

2024-07-14 16:36:30 1334

Credit Risk Fraud Detection

Credit Risk Fraud Detection

2024-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除