自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(85)
  • 收藏
  • 关注

原创 StarRocks执行原理与SQL性能优化策略探索

然后第二阶段会收集上游每个instance的分组结果,完成全局的去重操作,并进行第一阶段的分组统计(即按日期统计当前instance数据中日期维度对应的uv)。最后根据日期分桶交由第三阶段计算全局的uv,这里可以看到实际第三阶段还是会存在数据倾斜的情况(即数据最后还是只会由7个instance进行处理),但是这里由于上游为统计后的数据,分组键与聚合值占用空间并不大(只有一个日期和一个统计值),所以不容易造成OOM,而且第三阶段的最终聚合也只要将相同分组的统计结果进行加和即可。

2025-04-07 13:47:23 307

原创 sql题解--打折日期交叉问题

2) 比较start_date 与 移动下来的数据, 如果开始时间大, 则不需要操作, 反之则将移动下来的数据加一替换当前行的开始时间。1) 将当前行以前的数据中最大的end_date放置到当前行。4) 按照品牌分组,计算每条数据加一后的总和。3) 将每行的结束时间减去开始时间。

2025-04-05 19:44:07 231

原创 简单了解RBO、CBO和HBO

简单了解RBO、CBO和HBO-阿里云开发者社区

2025-03-24 16:25:50 329

原创 java二分法

【代码】java二分法。

2025-03-11 22:57:55 87

原创 StarRocks 实时数据分析

Flink+StarRocks 实时数据分析新范式-阿里云开发者社区

2025-03-07 15:20:30 372

原创 Hologres VS Doris

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践-阿里云开发者社区

2025-03-07 14:52:51 91

原创 能源电力大数据平台建设方案

智慧能源电力大数据平台建设方案:开启电力行业数字化转型新篇章_服务_运行态势

2025-03-03 22:43:24 106

原创 SQL打折日期交叉问题

比如vivo品牌,第一次活动时间为2021-06-05到2021-06-15,第二次活动时间为2021-06-09到2021-06-21其中9号到15号为重复天数,只统计一次,即vivo总打折天数为2021-06-05到2021-06-21共计17天。字段名:brand(品牌)、stt(打折开始日期)、edt(打折结束日期)。表名:good_promotion。编辑数据文件good_promotion.txt。② 计算每个商品总的打折销售天数。数据为平台商品促销数据。注意:其中的交叉日期。

2025-02-28 15:45:54 439

原创 SQL分组问题

② 统计每个用户连续的访问记录中,如果时间间隔小于6s,就分为一个组(统计某个用户连续的访问记录,如果时间间隔小于60s,就分为一组。编辑文件user_visit.txt。下列为电商公司用户访问时间数据。观察数是标准的时间戳吗。

2025-02-28 11:10:38 328

原创 StarRocks内部实时更新技术的实现方案

https://zhuanlan.zhihu.com/p/566219916

2025-02-27 19:12:22 112

原创 深度优先DFS

【代码】广度优先DFS。

2025-02-18 22:52:35 75

原创 广度优先BFS

【代码】广度优先BFS。

2025-02-18 22:51:51 97

原创 SQL间隔连续问题

② 计算每个用户最大的连续登录天数,可以间隔一天。如:如果一个用户在1,3,5,6登录游戏,则视为连续6天登录。1. 数据结构:某游戏公司记录的用户每日登录数据。② 计算每个用户最大的连续登录天数,可以间隔一天。字段名:id(用户id)、dt(日期)创建文件game_user.txt。表名:game_user。

2025-02-18 21:50:03 330

原创 FlinkSQL中使用UDTF

【代码】FlinkSQL中使用UDTF。

2025-02-10 16:38:44 74

原创 Leetcode面试高频题分类刷题总结

面试中最常考的(分类的稍微有点粗糙了,没有细分出回溯/分治来,准备找个时间给每个DFS的题标记下是哪种DFS)注意:后两题是与快速排序非常相似的快速选择(Quick Select)算法,面试中很常考。以下8个门类是面试中最常考的算法与数据结构知识点。和链表反转几乎是所有链表类问题的基础,尤其是。,代码很短,建议直接背熟。

2025-02-03 15:37:10 1136

原创 linux命令如何只将标准输出重定向到文件中,报错信息不重定向

【代码】linux命令如何只将标准输出重定向到文件中,报错信息不重定向。

2025-01-08 19:21:36 88

原创 Starrocks如何查看资源组

【代码】Starrocks如何查看资源组。

2025-01-08 13:50:59 123

原创 Starrocks如何添加bitmap索引

【代码】Starrocks如何添加bitmap索引。

2025-01-07 15:28:15 161

原创 Starrocks查看DDL操作后状态

【代码】Starrocks查看DDL操作后状态。

2025-01-06 20:29:08 106

原创 如何生成火焰图

【代码】如何生成火焰图。

2025-01-06 14:00:39 104

原创 Starrocks如何修复replica

【代码】Starrocks如何修复replica。

2025-01-02 15:38:00 122

原创 git如何把远端分支回退到某一commit id

【代码】git如何把远端分支回退到某一commit id。

2024-12-26 13:35:01 112

原创 撤销 Git 中标记为 “assume unchanged“ 的文件

要撤销 Git 中标记为 "assume unchanged" 的文件,你可以使用。

2024-12-26 11:23:55 127

原创 Starrocks如何修改最大连接数

【代码】Starrocks如何修改最大连接数。

2024-12-23 14:40:23 233

原创 Starrocks如何设置资源组

【代码】Starrocks如何设置资源组。

2024-12-16 11:12:41 146

原创 Shell脚本高并发压测

【代码】Shell脚本高并发压测。

2024-11-24 14:18:38 151

原创 docker无法拉取社区镜像

【代码】docker无法拉取社区镜像。

2024-11-20 15:39:40 359

原创 git如何回退到某个commit id

【代码】git如何回退到某个commit id。

2024-11-12 13:33:20 406

原创 Starrocks如何查看compaction状态

【代码】Starrocks如何查看compaction状态。

2024-11-11 19:30:55 167

原创 grep如何只查看末尾几条数据

【代码】grep如何只查看末尾几条数据。

2024-11-08 17:48:55 243

原创 grep命令从文件中抓取字符串返回一整行太长,如何只返回指定字符串附近的文字

【代码】grep命令从文件中抓取字符串返回一整行太长,如何只返回指定字符串附近的文字。

2024-11-06 14:27:43 154

原创 java代码模拟死锁,阻塞返回值

【代码】java代码模拟死锁,阻塞返回值。

2024-10-31 20:29:59 113

原创 Shell脚本打印转义字符

【代码】Shell脚本打印转义字符。

2024-10-25 16:20:31 111

原创 学习使用eclipse MAT查看OOM的问题

然后用Eclipse MAT打开hprof文件即可。

2024-10-18 22:18:56 134

原创 SparkSQL匹配正则表达式

【代码】SparkSQL匹配正则表达式。

2024-10-17 16:32:28 201

原创 QPS=并发数/接口平均耗时

QPS=并发数/接口平均耗时。

2024-10-14 14:50:57 450

原创 Starrocks报错com.starrocks.mysql.nio.AcceptListener$AfterConnectedException: Reach limit of connection

【代码】Starrocks报错com.starrocks.mysql.nio.AcceptListener$AfterConnectedException: Reach limit of connection。

2024-10-14 11:28:24 239

原创 利用CoreDump文件快速定位Doris的查询问题

Doris开发手记3:利用CoreDump文件快速定位Doris的查询问题 - HappenLee - 博客园

2024-09-25 11:44:26 176

原创 VSCode中如何把\n换成换行符

2024-09-18 13:50:41 240

原创 JDBC客户端连接Starrocks 2.5

【代码】JDBC客户端连接Starrocks 2.5。

2024-09-10 10:35:08 906

FutureOfWorld

FutureOfWorld

2025-02-13

Hudi文档Hudi文档Hudi文档

Hudi文档Hudi文档Hudi文档

2024-03-17

MsPaint for Mac

MsPaint for Mac

2024-02-18

MSpaint for Mac

MSpaint for Mac

2024-02-17

app.asarapp.asar

app.asarapp.asar

2024-01-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除