
Spark内核设计的艺术架构与实现读书笔记
Spark内核设计的艺术架构与实现 一书通过对源码的分析,详细的讲解了Spark的架构原理.值得细细品读.
TMH_ITBOY
System.out.println("代码是程序员的朋友,虽然没有热情,但是很真实");
____The most handsome ITBoy
展开
-
读《Spark内核设计的艺术 架构设计与实现》笔记之三----SparkConf & 内置的RPC框架
SparkConfSparkConf 是Spark的配置类,Spark中的每一个组件都直接或者间接的使用这个类存储的属性.SparkConf中,使用ConcurrentHaskMap来存储这些属性,其中key以及value都是String类型的./** 线程安全的,用于存储配置的各种属性 */ private val settings = new ConcurrentHashMap[Str...原创 2019-02-18 14:02:49 · 327 阅读 · 0 评论 -
读《Spark内核设计的艺术 架构设计与实现》笔记之之一----初识Spark
初识SparkSpark是一个通用的并行计算框架,由加州伯克利大学的AMP实验室开发于2009年,并于2010年开源.2013年在Apache旗下成长为大数据领域最活跃得开源框架之一,Spark也是基于map reduce算法模型实现的分布式计算框架.Spark 针对MapReduce做了大量优化.减少磁盘I/O Hadoop MapReduce的map端将中间输出和结果存储在磁盘中...原创 2019-02-15 16:37:43 · 353 阅读 · 0 评论 -
读《Spark内核设计的艺术 架构设计与实现》笔记之二----Spark模块设计
Spark模块设计整个Spark主要由Spark Core,Spark SQL,Spark Streaming,GraphX,MLlib组成,Spark Core是整个Spark体系的核心引擎,Spark SQL,Spark Streaming,GraphX,MLlib都是建立在Spark Core基础之上的.Spark的核心功能Spark Core中提供了Spark最基础最核心的功能,主...原创 2019-02-15 16:41:00 · 1083 阅读 · 0 评论