SQL及NoSQL案例分析
文章平均质量分 62
专栏收录SparkSQL、HiveSQL、FlinkSQL、MySQL、Hbase、Redis、Clickhouse等技术框架的经典练习题案例,来自各大厂真题,包含但不限于牛客网等。文章内容包括具体案例题目,分析解答,以及完整代码和案例数据集。
程序终结者
我先说好,我发的需求案例都是经过我测试的,具有普遍代表性的案例,如果有问题请检查环境配置。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Spark数仓项目】需求七:漏斗模型分析
将数组中元素按照:拼接成一个字符串 [1001_display:1002_addCart:1003_order:1004_pay]将一个设备的多个行为存储到数组中,并且排序 [1001_display,1002_addCart,1003_order,1004_pay]这段查询会将同一个设备的事件按照时间顺序拼接成一个字符串,并使用冒号作为分隔符,用于后续的分析和处理。2.然后在外层通过正则表达式匹配拼接后的字符串中的事件序列,然后根据不同的事件序列返回相应的步骤数。– 经过每个步骤的人数。原创 2023-07-07 00:09:40 · 958 阅读 · 2 评论 -
【Spark数仓项目】需求五:用户活跃范围开发-拉链表
通过建立用户的活跃时间段表,可以将用户的活跃时间段信息预先计算和存储起来,减少从dwd层重复查询的次数。这样可以在统计用户活跃需求时,直接从活跃时间段表中获取数据,提高查询的效率和性能,方便后续的数据分析和业务应用。原创 2023-07-04 07:39:31 · 707 阅读 · 1 评论 -
HiveSQL练习题:计算近一个月活跃、连续活跃、沉默用户需求
运算符筛选出符合条件的数据,即日期大于等于最近的 11 月 15 日前的 30 天。这行语句可以理解为统计最近 11 月 15 日前的 30 天内的用户数据。函数计算每个设备的唯一日期数,即活跃天数。本小节求出连续登录大于2天的数量,并进行汇总计算。列的值,这里是为了筛选出近一个月30天的数据。进行分组,并计算了每个分组中的行数,即。Step 4:对满足条件的分组再次进行了。这个需求比较简单,在需求一的基础上,增加对。对应的分组数,即为需求用户数。减去 30天的数据,并按。即为连续登录的日期。原创 2023-07-01 12:29:32 · 1481 阅读 · 0 评论 -
HiveSQL练习题-rank(),dense_rank(),row_number(),lag()开窗计算排名和分差
编写sql语句实现每班前三名,分数一样不并列,同时求出前三名按名次排序的一次的分差:原创 2023-06-23 11:11:41 · 264 阅读 · 0 评论 -
HiveSQL练习题-count,sum开窗统计月度数据,求月用户新增
【代码】HiveSQL练习题-count,sum开窗统计月度数据,求月用户新增。原创 2023-06-16 00:01:58 · 452 阅读 · 0 评论 -
SparkSQL练习题-DF读取.log文件,算子聚合去重开窗TOPN
【代码】SparkSQL练习题-DF读取.log文件,算子聚合去重开窗TOPN。原创 2023-06-15 09:54:45 · 184 阅读 · 0 评论 -
SparkSQL练习题-开窗函数计算用户月访问次数
计算用户月访问次数,使用sum开窗和max开窗原创 2023-06-14 23:38:13 · 338 阅读 · 0 评论
分享