- 博客(5)
- 收藏
- 关注
原创 HIVE中对于时间变换的处理
总结:1、月份处理函数:last_day、floor_month、trunc;2、年份处理函数:floor_year、trunc;3、时间区间处理函数选择:posexplode、split、space。
2022-07-12 19:00:09
2190
原创 蚂蚁金服SQL笔试题解答,同时遇到hive使用spark执行时不兼容问题。
蚂蚁金服SQL笔试题解答,同时遇到hive使用spark执行时不兼容问题。题目:用SQL计算:计算用户连续完成订单间隔最大的天数和最小的天数。一、按照题目需求解答(只需要找出用户的最大和最小连续区间):代码如下:执行结果: 二、思维扩展 需求:找出每个用户的最大和最小连续区间,并且求出最大和最小的持续天数。 分析:注意点,每个用户的...
2022-06-29 20:06:23
786
原创 HIVE在使用spark引擎执行计划时存在的代码解析兼容性问题
题目引入:请向用户推荐他的朋友收藏的商品,但是不要包括用户已经收藏过的商品。SQL代码:spark引擎执行结果:注意:该结果有误,分析两表join后的结果,发现左表没有数据显示! 最终结果没有起到过滤筛选的效果: 更换为MR引擎执行:结果如下图所示,该数据符合预期! 结论:猜想spark引擎在执行计算时与hive解析出来的执行代码存在兼容性问题。...
2022-06-26 17:34:17
768
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人