林子雨-5.2 键值对RDD

本文详细介绍如何在Spark中创建键值对RDD,包括从文件加载和通过并行集合创建的方法。深入探讨了reduceByKey和groupByKey等常用转换操作,以及keys、values、sortByKey、mapValues和join等高级功能,通过综合实例展示这些操作的实际应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

 

1、创建键值对RDD

从文件加载

通过并行集合创建

2、常用的键值对RDD转换操作(reduceByKey和groupByKey)

3、keys,values.sortByKey,mapValues,join

4、综合实例

 

1、创建键值对RDD

从文件加载

通过并行集合创建

2、常用的键值对RDD转换操作(reduceByKey和groupByKey)

groupByKey的valueList以Iterable的形式保存(放在Iterable容器中)

用groupByKey和reduceByKey完成词频统计

3、keys,values.sortByKey,mapValues,join

keys:把key取出形成新的RDD

values:与keys同理

sortByKey():默认按Key升序排序(false为降序)

sortBy():.sortBy(_._2,false)按值降序排序

mapValues(fanc)

只对value进行操作

join

4、综合实例

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值