刚面试的时候面试官问到Hive的 order by 和 sort by 的区别,没答出来,于是在网上找了一下,个人理解如下:
1、Order By
order by 排序出来的数据是全局有序的,但是只能有一个partition
2、Sort By
sort by 排序出来的数据是局部有序的,但是全局无序。即partition内部是有序的,但是partition与partition之间的数据时没有顺序关系的
本文介绍了Hive中OrderBy和SortBy的功能差异。OrderBy实现全局有序排序,但限制了分区数量;SortBy则实现了每个分区内的局部有序,整体上保持无序状态。
刚面试的时候面试官问到Hive的 order by 和 sort by 的区别,没答出来,于是在网上找了一下,个人理解如下:
order by 排序出来的数据是全局有序的,但是只能有一个partition
sort by 排序出来的数据是局部有序的,但是全局无序。即partition内部是有序的,但是partition与partition之间的数据时没有顺序关系的
648

被折叠的 条评论
为什么被折叠?