
源码
冬瓜螺旋雪碧
时间的加速度
展开
-
SparkSQL自定义外部数据源源码分析及案例实现
通过查看JDBC方式源代码入口分析: 源码分析 //继承BaseRelation的类必须能够以`StructType`的形式产生其数据模式。具体的实现应继承自后代Scan类之一 abstract class BaseRelation { def sqlContext: SQLContext def schema: StructType def sizeInBytes: Long = sq...原创 2019-12-05 21:05:57 · 523 阅读 · 0 评论 -
MapReduce作业提交源码分析
MapReduce原理图 job提交初步源码中主要方法提炼 boolean res = job.waitForCompletion(true); waitForCompletion{ submit(){ connect(); // 其实就是为了拿到一个cluster(Local YARN) submitJobInternal(){ ...原创 2019-08-28 16:03:17 · 322 阅读 · 0 评论 -
Spark 通过submit作业启动流程源码分析
Spark作业通过submit操作提交作业 一开始脚本通过执行 // 很明显这个类中绝对有Main方法, 脚本中 @$ 意思是启动时传递的一堆参数 org.apache.spark.deploy.SparkSubmit 类来启动程序 // 很明显 main方法中就调用了一个doSubmit方法而已,并将参数传进去 def main(args: Array[String]): Unit = ...原创 2020-03-31 11:44:43 · 339 阅读 · 0 评论