Spark和Flink当中的常用算子详解

1. Spark中Transformation算子

1.1. map

  • 每个元素都会调用一次map方法
  • 接收一个函数,把这个函数用于 RDD 中的每个元素,将函数的返回结果作为结果RDD 中对应元素的结果

1.2. lookup

  • lookup用于(K,V)类型的RDD,指定K值,返回RDD中该K对应的所有V值

1.3. mapPartitions

  • 每个分区调用一次mapPartitions方法
  • Return a new RDD by applying a function to each partition of this RDD
  • 详细链接

1.4. flatMap

  • 意思大概就是将f这个函数应用到Seq里的所有元素,并将函数产生的集合里的元素取出来,组成一个新的集合。然后返回这个新的集合
  • 详细链接

1.5. mapPartitionsWithIndex

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值