自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(365)
  • 收藏
  • 关注

原创 StarRocks 事务

starrocks 事务

2025-03-20 11:57:17 209

原创 SparkSQL query optimization

Spark, in recent years, has become the go-to distributed computation framework for a lot of different use cases. From only providing map-reduce funtionalities, it has introduced other modules: from machine learning, to graph data, to SQL.Today we will focu

2025-03-02 17:56:54 1053

转载 揭露数据不一致的利器 —— 实时核对系统

随着企业业务发展,以及微服务化大趋势下单体服务的拆分,服务间的通信交互越来越多。与单体服务不同,微服务间的数据往往需要通过额外的手段来保障一致性,例如事务消息、异步任务补偿等。除了从机制上最大程度保障以外,如何观测并及时发现数据不一致也非常重要。本文介绍 Shopee Financial Products 团队设计和开发的实时核对系统(Real-time Checking System)

2025-03-02 11:02:17 65

原创 Spark Tuning -- explaining Spark SQL Join Types

Spark join type

2025-02-25 03:29:34 998

原创 Dolphinscheduler 参数传递

参数传递

2025-02-10 18:28:03 246

翻译 Rapidly Changing Dimension (RCD) in Data Warehouse 杂项维度

杂项维度

2025-01-07 11:29:13 32

原创 企业微信——智能表格学习

企业微信报表

2025-01-03 14:04:27 3296

原创 Spark Optimization —— Reducing Shuffle

randomness。

2024-12-01 22:48:50 1336

原创 Apache Gravitino 元数据管理

元数据管理

2024-11-06 00:44:24 1157

转载 用户商品推荐

商品推荐

2024-10-23 11:46:47 100

原创 StarRocks FE启动异常

服务器断电,StarRocks FE 启动失败。

2024-10-22 20:07:04 515

原创 Starrocks 元数据恢复 failed to load journal type 10242

Starrocks 元数据恢复

2024-10-08 14:29:19 605

原创 Starrocks with 嵌套

在某些场景下需要进行 with 嵌套

2024-09-27 17:26:22 493

翻译 Recommender System using ALS in Pyspark

【代码】Recommender System using ALS in Pyspark。

2024-09-12 01:59:19 181

原创 Apifox 接口中文报 Request path contains unescaped characters

2024-08-29 18:48:13 199

原创 数值治理学习记录

数据治理

2024-07-02 17:29:47 219

转载 详解数据治理体系

数据治理

2024-07-02 15:37:06 161

翻译 How to develop an enterprise data warehouse from scratch to foster a data-driven culture

data warehouse

2024-06-21 17:16:36 135

原创 hive SQL264 牛客每个人最近的登录日期(五)

hive sql

2024-06-20 11:07:09 415

原创 hive on spark 记录

hive on spark 记录。

2024-06-17 15:05:23 605

原创 Stargo 管理部署 Starrocks 集群

Stargo

2024-03-16 13:17:50 844

原创 docker 子网

docker 子网

2024-03-09 15:44:37 723 1

原创 docker busybox 工具容器

linux busybox 工具

2024-03-09 15:28:37 613

原创 StarRocks 进行 streamload 导入本地数据 NULL value in non-nullable column

starrocks streamload

2024-03-02 14:23:21 886

转载 StarRocks 分页查询使用不同的排序列,导致查询结果不一致问题

StarRocks

2024-01-26 17:07:02 1100 1

转载 一文看懂Linux内核页缓存(Page Cache)

page Cache

2024-01-26 16:00:50 736

转载 虚拟机断电重启起不来 Failed to start Login Service

背景:电脑断电,虚拟机无法启动。

2024-01-13 02:26:52 2062

原创 StartRocks 连接 Paimon外部表

startRocks paimon

2023-11-30 17:09:57 1003

原创 Dinky 整库同步至 Paimon 数据湖

dinky paimon

2023-11-30 10:59:36 1267

原创 docker devicemapper: Error running DeleteDevice dm_task_run failed

docker devicemapper 删除容器异常

2023-11-25 22:06:46 1287

原创 Mysql 字符集 Illegal mix of collations

mysql 字符集

2023-11-06 15:31:52 180

原创 Mysql 非正常关闭,启动异常

Mysql 启动异常

2023-11-01 18:00:17 803

原创 Linux流量监控

流量监控

2023-10-23 17:57:20 228

原创 NFS 挂载异常 Output: mount: wrong fs type, bad option, bad superblock on xxx

nfs 挂载异常

2023-10-15 16:44:24 333

转载 Apache Doris Colocate Join 原理实践教程

doris Colocate Join

2023-10-10 16:00:24 362

转载 BitMap学习

bitmap

2023-10-10 10:15:05 106

原创 ping通但浏览器访问不了

网络异常

2023-09-28 14:41:40 246

转载 增量表、全量表、拉链表的应用场景及优缺点详解

事实——增量表、全量表、拉链表、快照表

2023-09-26 11:24:45 3059

原创 kafka latest 模式消费偏移丢数据

flink kafka

2023-09-25 11:07:23 603

转载 数仓概念 | 逻辑 | 物理模型

数仓概念模型、逻辑模型、物理模型

2023-09-10 23:33:36 124

DQO 数据质量电子书、

DQO 数据质量电子书、

2025-03-25

hive 优化策略、、、、

hive 优化策略、、、、

2024-12-03

数据质量管理:6个维度,50个检查项

数据质量管理:6个维度,50个检查项

2024-11-05

个人Linux学习笔记

个人Linux学习笔记

2024-10-20

Developing High Quality Data Models

Developing High Quality Data Models

2023-10-18

CDH 集群安装文档参考

CDH 集群安装文档参考

2023-08-30

Flink Atlas 整合

Flink Atlas 整合

2022-09-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除