- 博客(1)
- 收藏
- 关注
原创 Hive 将数据插入hive动态分区表或hdfs动态分区目录的优化 distribute by分区排序的应用
将数据插入动态分区可能会导致短时间内(map任务)产生大量的分区(大于分区列的值去重后的数量),导致资源消耗过大,因此 3个用于保护自己的参数。 Dynamic partition insert could potentially be a resource hog in that it could generate a large number of partitions in a short time. To get yourself buckled, we define three paramete
2021-12-27 14:37:21
1494
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人