自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Flink SQL踩坑记录-IF函数

业务需要将部分离线数仓看板改实时,选择Flink SQL脚本实现,改写Hive SQL过程中有两个关于IF函数的报错点。

2025-02-06 21:06:50 1713

原创 数据倾斜记录-开窗函数

在第二种查询中,是对ROW_NUMBER()函数的结果进行了筛选,只保留了每个user_id分区的第一行,然后再与原始表进行JOIN操作。在第一种查询中,first_value函数会在每个user_id分区内,将第一个province_name的值赋给所有的行。这个过程需要在内存中维护每个user_id分区的所有数据,如果一个user_id分区的数据量非常大,那么这个复制操作可能会占用大量的内存和计算资源,从而导致数据倾斜。

2024-11-13 00:40:18 310

原创 复习笔记一

数据开发复习笔记第一部分

2022-09-25 21:23:38 1674 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除