
Spark 面试题系列
之前在知乎上整理过一些 Spark 常问的面试题,知识有点老旧了,而且当时没有太注重排版,计划从这篇开始,逐渐将原来的面试题文档给取代掉,预计每篇大概整理10条问题,对 Spark 一些基础知识点,尤其是面试的时候会碰到的问题,来一个总结。
runzhliu
毕业于中山大学,目前专注于容器和大规模并行计算
展开
-
Spark 面试题系列-2
文章目录1 RDD 如何通过记录更新的方式容错2 Spark 优越性Spark 的几个优势MapReduce 与 Spark 相比,有哪些异同点3 Transformation 和 action 是什么?区别?举几个常用方法4 RDD 容错方式5 可以解释一下这两段程序的异同吗6 说说 map 和 mapPartitions 的区别7 groupByKey 和 reduceByKey 是属于 Tr...原创 2019-07-26 10:44:36 · 921 阅读 · 0 评论 -
Spark 面试题系列
之前在知乎上整理过一些 Spark 常问的面试题,知识有点老旧了,而且当时没有太注重排版,计划从这篇开始,逐渐将原来的面试题文档给取代掉,预计每篇大概整理10条问题,对 Spark 一些基础知识点,尤其是面试的时候会碰到的问题,来一个总结。总结的顺序可能是无序的,也就是说,不一定是由浅入深,但是应该是比较「口水化」的问答模式,适合对 Spark 还不是相当熟悉的读者。...原创 2019-07-24 18:41:49 · 790 阅读 · 1 评论 -
Spark 面试题系列-1
文章目录1 Spark为什么快,Spark SQL 一定比 Hive 快吗2 RDD, DAG, Stage, Task 和 Job 怎么理解?3 宽依赖、窄依赖怎么理解?4 Spark 作业提交流程是怎么样的5 为什么要用 Yarn 来部署 Spark?6 简单说说 Spark 支持的4种集群管理器7 说说 Worker 和 Executor 的区别8 说说 Spark Local 和 Stan...原创 2019-07-24 18:42:30 · 1254 阅读 · 0 评论