自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 大数据面试问题Hive、Spark

groupByKey按照key进行分组,没有聚合,直接进行shuffle。会先对分区内部分组,分组完成后进行shuffle,将相同的键从各个分区汇总到一起,再合并。按照key进行聚合,会在shuffle之前进行预聚合。现在分区内部对所有的键-值对进行遍历,遇到相同的key就会执行自定义的聚合逻辑。在每个分区内完成局部预聚合后,就会进行shuffle操作,分区分组聚合,先在不同的分区内进行分组预聚合,再对不同分区的预聚合后的结果进行聚合。特点,分区内的聚合逻辑可以与分区之间聚合逻辑不一样。

2025-01-09 12:04:58 763 1

原创 Linux安装mysql详细教程

转载自:linux 安装mysql8.0 超详细图文教程_linux mysql8 下载安装-优快云博客第九步初始化之前看这个:初始化mysql时报错误“error while loading shared libraries: libaio.so.1: cannot open shared object file: No such file or directory ”的解决方法 - 夏圈圈儿 - 博客园

2023-12-19 15:52:27 353 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除