Spark RDD经典基础面试题

本文主要探讨Spark RDD在面试中常见的基础问题,包括SparkContext、DAG、RDD、Transformation和Action的创建及执行位置。关键点在于理解大部分操作在Driver端定义,而Executor端执行具体任务。此外,还涉及分区器、广播变量和累加器的使用与特性。

Spark RDD经典基础面试题

面试基础题

  1. SparkContext哪一端创建的的?
    Driver端
  2. DAG是在哪一端被构建的?
    Driver端
  3. RDD是在哪一端生成的?
    Driver端
  4. 调用RDD的算子(Transformation和Action)是在哪一端调用的
    Driver端
  5. RDD在调用Transformation和Action时需要传入函数,函数是在哪一端声明【定义】和传入的?
    Driver端
  6. RDD在调用Transformation和Action时需要传入函数,请问传入的函数是在哪一端执行了函数的业务逻辑?
    Executor
  7. Task是在哪一端生成的呢?
    Driver端
  8. DAG是在哪一端构建好的并被切分成一到多个Stage的
    Driver端
  9. DAG是哪个类完成的切分Stage的功能?
    DAGScheduler
  10. DAGScheduler将切分好的Task以什么样的形式给TaskScheduler
    TaskSet
  11. 自定义的分区器这个类是在哪一端实例化的?
    Driver端
  12. 分区器中的getParitition方法在哪一端调用的呢?
    Executor
  13. 广播变量是在哪一端调用的方法进行广播的?
    Driver端
  14. 要广播的数据应该在哪一端先创建好再广播呢?
    Driver端
  15. 广播变量以后能修改吗?
    不能
  16. 广播变量广播到Executor后,一个Executor进程中有几份广播变量的数据
    一个
  17. 累加器事先在哪一端创建的
    Driver端
  18. 累加器事先在哪一端累加的
    Executor
  19. shuffle算子是否一定会触发shuffle
    不会,需
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值