自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 SQL练习-用户留存问题

- 课程表21:00');-- 上课情况表上课情况表(attend_tb)课程表(course_tb)变式的难点主要是要对时间字段进行处理,可以用最简单的截取字符串并转换为datetime,还有对时间字段进行筛选-- 解析课程时间段为开始和结束时间SELECTcourse_id,' ',' ',),-- 计算核心时段(课前15分钟至课后5分钟)SELECTcourse_id,),-- 合并进出事件并过滤核心时段SELECT。

2025-05-27 11:04:22 661 1

原创 SQL练习-用户留存问题

explode函数是Hive/SQL中的表生成函数(UDTF),用于将数组或映射类型的列展开为多行数据。但是缺点很明显,太长了,我们可以直接使用UDTF函数explode进行爆炸,来减少代码行数。如果现在还有求三日和七日的留存率怎么办呢,很简单,可以直接在原代码的基础上多计算几个指标。② 展开后的行数取决于原数组/映射的元素数量,空数组会产生零行。array_column:数组类型的列,元素会被展开为多行。map_column:映射类型的列,键值对会被展开为多行。首先我们需要剖析题目。

2025-05-26 13:09:06 980 1

原创 SQL练习-连续类问题

• artical_id-文章 ID 代表用户浏览的文章的 ID,特殊情况 artical_id-文章 ID 为 0 表。• 如果签到记录的 in_time-进入时间和 out_time-离开时间跨天了,也只记作 in_time。• 从 2021 年 7 月 7 日 0 点开始,用户每天签到可以领 1 金币,并可以开始累积签到。• 每连续签到 7 天后重新累积签到天数(即重置签到天数:连续第 8 天签到时记为。天数,连续签到的第 3、7 天分别可额外领 2、6 金币。新的一轮签到的第一天,领 1 金币)

2025-05-20 12:52:58 528

原创 SQL练习-时间间隔类题目

本文介绍了两种解决时间间隔类题目的方法,主要针对SQL查询中计算用户登录时间间隔的需求。

2025-05-18 15:33:07 525

原创 IceBerg的自我学习(3)

存储过程是IceBerg中的强大特性,通过CALL catalog.system.produce_name语法调用,支持按名称传递参数。

2025-05-17 11:45:05 2318

原创 IceBerg的自我学习(2)

个人建议:新项目最好都优先使用V2,除非是纯增量写入就选择V1。

2025-05-10 11:39:33 874

原创 IceBerg自我学习(1)

在最近的知识学习中,感觉到自己技术栈的匮乏,因此想扩展一下自己的技术面,在自我了解和咨询下,决定开始学习IceBerg,以下皆是自我学习的成果,希望记录下来也能更好的让自己理解,如果有不对的希望大佬可以指正IceBerg是数据湖的一种,在我看来,他的出现主要是为了解决Hive的一些痛点,比如海量分区耗时过长元数据信息分散到HDFS和MYSQL上,难以保证写入原子性没有文件级别的统计信息,因此fillter过滤的时候,只能过滤partition对底层文件系统的复杂语义依赖这是我在网上了解到的一些痛点,之后又了

2025-05-03 15:56:17 1910 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除