- 博客(1)
- 资源 (1)
- 收藏
- 关注
转载 Hive 窗口函数、分析函数
1 分析函数:用于等级、百分点、n分片等 Ntile 是Hive很强大的一个分析函数。 可以看成是:它把有序的数据集合 平均分配 到 指定的数量(num)个桶中, 将桶号分配给每一行。如果不能平均分配,则优先分配较小编号的桶,并且各个桶中能放的行数最多相差1。语法是: ntile (num) over ([partition_clause] order_by_c
2017-02-23 10:32:42
459
hive优化.docx
主要介绍了hive开发过程中常见的性能问题及优化方法:
数据倾斜:
1)group by 数据倾斜
2)join 数据倾斜
3)reduce数过少
4)大小表关联
动态分区
并行
小文件过多
等等
2019-12-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人