Spark(2)-基础tranform算子(一)

本文详细介绍了ApacheSpark中的各种基本算子,包括map、flatMap、filter、mapPartitions、mapPartitionsWithIndex等,以及它们在处理RDD中的应用,同时提供了相应的代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、算子列表

编号 名称
1 map算子
2 flatMap算子
3 filter算子
4 mapPartitions算子
5 mapPartitionsWithIndex算子
6 keys算子
7 values算子
8 mapValues算子
9 flatMaplValues算子
10 union算子
11 reducedByKey算子
12 combineByKey算子
13 groupByKey算子
14 foldByKey算子
15 aggregateByKey算子
16 ShuffledRDD算子
17 distinct算子
18 partitionBy算子

 二、代码示例

package sparkCore


import org.apache.hadoop.mapreduce.task.reduce.Shuffle
import org.apache.log4j.{Level, Logger}
import org.apache.spark.rdd.{RDD, ShuffledRDD}
import org.apache.spark.rdd.RDD.rddToPairRDDFunctions
import org.apache.spark.{Aggregator, HashPartitioner, SparkConf, SparkContext, TaskContext}

/**
 * spark基本算子
 */


object basi_transform_02 {
  def main(args: Array[String]): Unit = {


    val conf: SparkConf = new SparkConf().setAppName("transform").setMaster("local[*]")
    val sc: SparkContext = new SparkContext(conf)

    sc.setLogLevel
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值