Spark-Core之算子详解(七)

本文深入解析SparkCore中的算子,重点介绍了Transformations和Actions两类算子。Transformations算子如map,是一种惰性算子,仅在触发Action时执行。Actions算子则用于触发实际计算。文章将逐步解析各个算子的原理和源码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SparkCore 算子详解
  开始之前,先希望大家生活乐观,天天向上。没有风可以把温柔的人吹倒,但温柔的风一定能吹散所有的不愉快。希望大家在为生活奔波的同时不忘初心,砥砺前行,永远能打倒困难。


  SparkCore是spark的核心内容,是早起实现数据处理的主要Spark工具,前面说了SparkCore数据处理就是就是RDD之间的互相转换,那么怎么样让RDD实现随心所欲的转换呢?

Spark算子是实现RDD转换的唯一手段。


Spark算子主要分为两大类Transformations、Action,推荐Spark官网地址

1、Transformations算子
  哈哈哈,先说说Transformations算子,因为刚开始学习Spark那会,Transformations算子总是让我头皮发麻,map算子已经是我理解的极限了,想想都是泪了。但是作为过来人,很高兴的是刀山火海后已经了解了,哈哈哈哈哈哈。好了 ,我是菜鸟,至于transformations算子,实际上是一种惰性算子,何为惰性,相当于老师布置了作业,但是不催我就是不写,哎,就是玩。只有这合适的触发器(action算子,相当于老师的苦口婆心)下。才会执行。那Transformations算子有哪些呢,怎么用?为什么要用?主要是实现什么功能呢?
这里是官网描述的常用Transformations算子。

transformations   算子类型 Meaning or funcrton
map(func) 单值算子 传递一个函数,将原RDD中每一个元素经过函数操作,转换成新的RDD,注意RDD的类型没有变,只是RDD中的元素经过一对一转换成为了新的数值或者数据类型,这个应该是最朴素的RDD转换算子
filter(func) 单值算子 过滤算子,将原RDD的元素经过过滤条件,如果为真则留下,为假则过滤掉。
flatMap(func) 单值算子 数据扁平化算子,对集合中每个元素进行操作然后再扁平化。所谓扁平化,我理解的就是降维。
mapPartitions(func) 单值算子 类似于 map,但是不同处在于map针对单个元素,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值