自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_15138049的博客

原创 dolphinscheduler 依赖节点不通过

dolphinscheduler 节点依赖，某个依赖报依赖不通过。master、worker、 api 程序执行添加。但 ds 所在的服务器时间是正确的。

2025-08-13 14:42:05 232

原创 Apache Ranger 权限管理

【代码】Apache Ranger 权限管理。

2025-07-25 17:38:29 423

原创 DWS层新增指标处理方案

业务逻辑确认：与业务方或需求方深入沟通，清晰定义新指标的计算公式、统计口径（维度、粒度）、业务含义、是否允许为空、默认值是什么。数据来源确认：确定计算该指标所需的最细粒度数据来源：是否完全依赖现有 DWS 层数据即可计算？(最理想情况，影响最小)是否需要依赖 DWD (Data Warehouse Detail) 层的明细数据？(需要向下追溯)是否需要依赖 ODS (Operational Data Store) 层或其他外部数据源？(影响较大，需评估数据质量和接入)历史数据要求。

2025-06-12 18:11:31 773

转载 LD_LIBRARY_PATH

【代码】LD_LIBRARY_PATH。

2025-06-02 21:09:00 132

原创记一次 Starrocks be 内存异常宕机

突发性 be 内存飙高，直至被系统 kill 掉，be 内存如下：其中指标打满，重启也是如此看到被 kill 了每次重启 be 都会去拉起 tablet: 3544744及。

2025-05-29 16:20:53 1040

原创 StarRocks 异常 Table creation timed out.

【代码】StarRocks 异常 Table creation timed out.

2025-04-22 16:16:48 253

原创 StarRocks 事务

starrocks 事务

2025-03-20 11:57:17 459

原创 SparkSQL query optimization

Spark, in recent years, has become the go-to distributed computation framework for a lot of different use cases. From only providing map-reduce funtionalities, it has introduced other modules: from machine learning, to graph data, to SQL.Today we will focu

2025-03-02 17:56:54 1149

转载揭露数据不一致的利器 —— 实时核对系统

随着企业业务发展，以及微服务化大趋势下单体服务的拆分，服务间的通信交互越来越多。与单体服务不同，微服务间的数据往往需要通过额外的手段来保障一致性，例如事务消息、异步任务补偿等。除了从机制上最大程度保障以外，如何观测并及时发现数据不一致也非常重要。本文介绍 Shopee Financial Products 团队设计和开发的实时核对系统（Real-time Checking System）

2025-03-02 11:02:17 256

原创 Spark Tuning -- explaining Spark SQL Join Types

Spark join type

2025-02-25 03:29:34 1190

原创 Dolphinscheduler 参数传递

参数传递

2025-02-10 18:28:03 840

翻译 Rapidly Changing Dimension (RCD) in Data Warehouse 杂项维度

杂项维度

2025-01-07 11:29:13 105

原创企业微信——智能表格学习

企业微信报表

2025-01-03 14:04:27 7595

原创 Spark Optimization —— Reducing Shuffle

randomness。

2024-12-01 22:48:50 1398

原创 Apache Gravitino 元数据管理

元数据管理

2024-11-06 00:44:24 1568

转载用户商品推荐

商品推荐

2024-10-23 11:46:47 285

原创 StarRocks FE启动异常

服务器断电，StarRocks FE 启动失败。

2024-10-22 20:07:04 894

原创 Starrocks 元数据恢复 failed to load journal type 10242

Starrocks 元数据恢复

2024-10-08 14:29:19 707

原创 Starrocks with 嵌套

在某些场景下需要进行 with 嵌套

2024-09-27 17:26:22 746

翻译 Recommender System using ALS in Pyspark

【代码】Recommender System using ALS in Pyspark。

2024-09-12 01:59:19 232

原创 Apifox 接口中文报 Request path contains unescaped characters

2024-08-29 18:48:13 276

原创数值治理学习记录

数据治理

2024-07-02 17:29:47 242

转载详解数据治理体系

数据治理

2024-07-02 15:37:06 206

翻译 How to develop an enterprise data warehouse from scratch to foster a data-driven culture

data warehouse

2024-06-21 17:16:36 193

原创 hive SQL264 牛客每个人最近的登录日期(五)

hive sql

2024-06-20 11:07:09 455

原创 hive on spark 记录

hive on spark 记录。

2024-06-17 15:05:23 679

原创 TPCH 导入Starrocks

【代码】TPCH 导入Starrocks。

2024-04-26 21:33:58 156

原创 Stargo 管理部署 Starrocks 集群

Stargo

2024-03-16 13:17:50 909

原创 docker 子网

docker 子网

2024-03-09 15:44:37 754 1

原创 docker busybox 工具容器

linux busybox 工具

2024-03-09 15:28:37 660

原创 StarRocks 进行 streamload 导入本地数据 NULL value in non-nullable column

starrocks streamload

2024-03-02 14:23:21 1096

转载 StarRocks 分页查询使用不同的排序列,导致查询结果不一致问题

StarRocks

2024-01-26 17:07:02 1574 1

转载一文看懂Linux内核页缓存（Page Cache）

page Cache

2024-01-26 16:00:50 859

转载虚拟机断电重启起不来 Failed to start Login Service

背景：电脑断电，虚拟机无法启动。

2024-01-13 02:26:52 2555

原创 StartRocks 连接 Paimon外部表

startRocks paimon

2023-11-30 17:09:57 1166

原创 Dinky 整库同步至 Paimon 数据湖

dinky paimon

2023-11-30 10:59:36 1411

原创 docker devicemapper: Error running DeleteDevice dm_task_run failed

docker devicemapper 删除容器异常

2023-11-25 22:06:46 1416

原创 Mysql 字符集 Illegal mix of collations

mysql 字符集

2023-11-06 15:31:52 209

原创 Mysql 非正常关闭，启动异常

Mysql 启动异常

2023-11-01 18:00:17 978

原创 Linux流量监控

流量监控

2023-10-23 17:57:20 254

DQO 数据质量电子书、

DQO 数据质量电子书、

2025-03-25

hive 优化策略、、、、

hive 优化策略、、、、

2024-12-03

数据质量管理：6个维度，50个检查项

数据质量管理：6个维度，50个检查项

2024-11-05

个人Linux学习笔记

个人Linux学习笔记

2024-10-20

Developing High Quality Data Models

Developing High Quality Data Models

2023-10-18

CDH 集群安装文档参考

CDH 集群安装文档参考

2023-08-30

Flink Atlas 整合

Flink Atlas 整合

2022-09-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除