Spark算子--Scala版本

转换算子之map和distinct算子

任务描述

本关任务:输出每个元素及其长度并去重。

相关知识

为了完成本关任务,你需要掌握map算子以及distinct算子的的用法。

map 算子

map(func):将函数应用于RDD中的每个元素,将返回值构成新的RDD,示例如下:

  1. val list=List(1,2,3)
  2. val rdd=sc.parallelize(list)
  3. val rdd1=rdd.map(x=>x+1)
  4. rdd1.foreach(println)

结果: 2 3 4

说明:rdd.map(x=>x+1)表示将rdd中的每个元素x1得到新的rdd1(2,3,4)

distinct 算子

distinct():去重

  1. val list=List(1,2,3,2,3)
  2. val rdd=sc.parallelize(list)
  3. val rdd1=rdd.distinct()
  4. rdd1.foreach(println)

结果为: 1 3 2

说明:表示将rdd(1,2,3,2,3)通过rdd.distinct()对元素去重,生成新的rdd1(1,2,3)

编程要求

根据提示,在右侧编辑器begin-end处补充代码,输出每个元素及其长度并去重。

测试说明

平台会对你编写的代码进行测试:

预期输出:

(an,2) (dog,3) (cat,3)

import org.apache.spark.rdd.RDD

import org.apache.spark.{SparkConf, SparkContext}

object EduCoder1 {

    def main(args: Array[String]): Unit = {

    val conf =new SparkConf().setAppName("educoder1").setMaster("local")

    val sc=new SparkContext(conf)

    val rdd = sc.parallelize(List("dog","an","cat","an","cat"))

    /********** Begin **********/

    //第一步:通过获取rdd中每个元素的长度创建新的rdd1

    val rdd1 = sc.parallelize(List(3,2,3,2,3))

    //第二步:通过zip把rdd1和rdd组合创建rdd2

    val rdd2=rdd.zip(rdd1)

    //第三步:去重

    val rdd3=rdd2.distinct()

    //第四步:输出结果

    rdd3.foreach(println)

    /********** End **********/

    sc.stop()

  }

}

转换算子之flatMap和filter算子

任务描述

本关任务:输出个数大于一的单词。

相关知识

为了完成本关任务,你需要掌握filter算子以及flatMap算子。

flatMap 算子

flatMap(func):将函数应用于RDD中的每个元素,将返回的迭代器的所有内容构成新的RDD,示例如下:

  1. val list=List(1,2,3)
  2. val rdd=sc.parallelize(list)
  3. val rdd1=rdd.flatMap(x=>x.to(3))
  4. rdd1.foreach(println)

结果为: 1 2 3 2 3 3

说明:flatMapMap的区别,map函数会对每一条输入进行指定操作,然后为每一条输入返回一个对象;而flatmap函数则是两个操作的集合,最后将所有对象合并为一个对象

filter 算子

filter(func):筛选出满足函数的元素,并返回一个新的RDD,示例如下:

  1. val list=List(1,2,3)
  2. val rdd=sc.parallelize(list)
  3. val rdd1=rdd.map(x=>x+1)
  4. val rdd2=rdd1.filter(x=>x&g
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值