spark总结4 算子问题总结
官网上最清晰
sc 启动spark时候就已经初始化好了
sc.textFile后 会产生一个rdd
spark 的算子分为两类
一类 Transformation 转换
一类 Action 动作
Transformation 延迟执行 记录元数据信息 当计算任务触发Action时候才会真正的开始计算
本文介绍了Spark中的算子分类,包括转换(Transformation)和动作(Action)两大类,并详细解释了它们的工作原理。文章还强调了Transformation操作的延迟执行特性,即这些操作会在遇到Action时才真正开始执行。
官网上最清晰
sc 启动spark时候就已经初始化好了
sc.textFile后 会产生一个rdd
spark 的算子分为两类
一类 Transformation 转换
一类 Action 动作
Transformation 延迟执行 记录元数据信息 当计算任务触发Action时候才会真正的开始计算
941
1万+
1210

被折叠的 条评论
为什么被折叠?