
Spark源码系列
文章平均质量分 92
主要内容为Spark源码阅读笔记,每篇笔记以一个主题串讲Saprk的知识点,并且记录相关的代码执行流程。各个组件的关系,作用等等。
桃花源养鸡
这个作者很懒,什么都没留下…
展开
-
Spark DAG的生成和Task的提交,启动,执行源码
Spark DAG的生成和Task的提交我们在执行spark任务的时候,可能会好奇任务的执行流程是什么,dag是怎么生成的,task是在哪里启动的,driver和executor是怎么通信的,等等。下面我们通过一个简单的spark wordcount任务,来粗略了解下其中的奥秘。SparkSession的创建我们在开发spark作业的时候,首先会需要创建spark任务的入口类SparkSession的对象:SparkSession spark =SparkSession.builder().ap原创 2022-04-07 20:10:12 · 1809 阅读 · 0 评论 -
Spark内存分析
本文简要介绍了spark内存中storage和execution内存的获取逻辑,摘取源码部分片段加以分析原创 2022-02-15 17:24:35 · 2215 阅读 · 0 评论 -
Spark任务提交源码
本文主要介绍了spark源码提交的流程,从SparkSubmit类main方法跟踪到spark主要实体driver和executor的创建过程,记录了整个过程中比较重要的节点的源码,以及对相关方法的功能实现进行了简要介绍。原创 2022-03-30 21:25:14 · 3556 阅读 · 1 评论