文章目录
• 1 countByKey
• 2 join
• 3 leftOuterJoin
• 4 rightOuterJoin
• 5 partitionBy
• 6 combineByKey
• 7 aggregateByKey
• 8 foldByKey
• 9 groupByKey
• 10 flatMapValues
• 11 mapValues
• 12 groupWith
• 13 cogroup
• 14 sampleByKey
• 15 subtractByKey
• 16 subtract
• 17 keyBy
• 18 repartition
• 19 coalesce
• 20 zip
• 21 zipWithIndex
• 22 zipWithUniqueId
countByKey

|
|
join

|
|
leftOuterJoin
|
|
rightOuterJoin

|
|
partitionBy

|
|
combineByKey

|
|
aggregateByKey

|
|
foldByKey
|
|
groupByKey

|
|
flatMapValues
|
|
mapValues

|
|
groupWith

|
|
cogroup

|
|
sampleByKey

|
|
subtractByKey

|
|
subtract

|
|
keyBy

|
|
repartition

|
|
coalesce

|
|
zip

|
|
zipWithIndex

|
|
zipWithUniqueId

|
|
本文深入探讨了Apache Spark中RDD的各种操作,包括转换和行动操作,如countByKey、join、groupByKey等,通过实例展示了如何使用这些操作进行高效的数据处理。
867

被折叠的 条评论
为什么被折叠?



