19、Spark数据处理与垃圾邮件过滤实战

Spark实现垃圾邮件过滤

Spark数据处理与垃圾邮件过滤实战

1. 键值对RDD的常见连接操作

在处理键值对RDD时,Spark提供了多种连接操作,下面列出了一些常见的连接操作及其结果示例:
| 转换操作 | 结果(假设rdd1为 { quick -> 1, brown -> 2, quick -> 3, dog -> 4 },rdd2为 { quick -> 78, brown -> 79, fox -> 80 }) |
| — | — |
| rdd1.join(rdd2) | { quick -> (1, 78), quick -> (3, 78), brown -> (2, 79) } |
| rdd1.leftOuterJoin(rdd2) | { dog -> (4, None), quick -> (1, Some(78)), quick -> (3, Some(78)), brown -> (2, Some(79)) } |
| rdd1.rightOuterJoin(rdd2) | { quick -> (Some(1), 78), quick -> (Some(3), 78), brown -> (Some(2), 79), fox -> (None, 80) } |
| rdd1.fullOuterJoin(rdd2) | { dog -> (Some(4), None), quick -> (Some(1), Some(78)), quick -> (Some(3), Some(78)), brown -> (Some(2), S

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值