- 博客(6)
- 收藏
- 关注
原创 【Hive】部分基础语法/调参优化
Hive优化的核心思想: 减少数据量(例如分区等操作) 避免数据倾斜(例如加参数,打散key值等的操作) 避免全表扫描(where过滤,特定分区等的操作,和减少数据量目标一致) 减少job数(相同的on条件放在一起作为一个任务)下面就日常工作总结出的一些基础优化点,从以下几方面分开阐述代码层面:数据倾斜问题:Job任务调参:
2024-04-05 23:00:28
358
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人