自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 问答 (1)
  • 收藏
  • 关注

原创 spark源码学习-RDD

RDD包含一组分片(Partition),是数据集的基本组成单位,每个partition都会被一个Task任务处理。用户可以在创建RDD时指定分片个数。计算每一个分区的函数,由子类RDD实现。描述当前RDD是符合依赖父RDD的,也就是所谓的血缘关系。当RDD中部分partition数据丢失时,可以通过依赖关系重建该分区数据,而不是对整个RDD的所有分区都重新计算!RDD的分片函数,比如HashPartitioner、RangePartitioner。只有对key-value的RDD才会有Partiti

2025-03-24 18:41:19 921

原创 spark源码学习-数仓践行者课程整理 二

学习资料整理

2024-02-19 17:35:22 856

原创 spark源码学习-数仓践行者课程整理 一

学习资料整理

2024-02-19 16:37:50 966

原创 Spark/SparkSQL-生产问题汇总

Spark/SparkSQL-生产问题汇总

2023-03-09 20:24:27 848

原创 spark源码学习-错误汇总

spark源码学习-错误汇总

2023-02-09 20:15:33 454

原创 hadoop/hive-生产问题记录

hadoop/hive-生产错误记录

2023-02-09 14:40:37 540

原创 Hive学习(二)窗口函数源码阅读2

窗口函数源码阅读

2023-02-06 01:26:06 427 1

原创 实时数据处理集群jvm内存泄漏排查

2022年年底排查jvm内存泄漏的过程记录。

2023-02-03 18:40:58 594 1

原创 Hive学习(一)窗口函数源码阅读

窗口函数源码阅读

2023-02-03 01:28:24 597

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除