Spark——RDD算子

本文深入探讨了Spark RDD API的使用案例,包括mapPartitionsWithIndex、repartition、coalesce、collectAsMap等关键操作的详细解释及示例代码。通过实际应用场景,读者将能全面理解这些操作在数据处理和优化中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

http://homepage.cs.latrobe.edu.au/zhe/ZhenHeSparkRDDAPIExamples.html

/////\\\\\\


mapPartitionsWithIndex
val rdd1=sc.parallelize(List(1,2,3,4,5,6,7,8,9),2)
def myfunc(index: Int, iter: Iterator[(Int)]) : Iterator[String] = {
        iter.map(x => "[partID:" +  index + ", val: " + x + "]")
      }
rdd1.mapPartitionsWithIndex(myfunc).collect
res1: Array[String] = Array([partID:0, val: 1], [partID:0, val: 2], [partID:0, val: 3], [partID:0, val: 4], [partID:1, val: 5], [partID:1, val: 6], [partID:1, val: 7], [partID:1, val: 8], [partID:1, val: 9])

repartition
val rdd2 = rdd1.repartition(3)
rdd2.partitions.length
res5: Int = 3
rdd2.mapPartitionsWithIndex(myfunc).collect
res6: Array[String] = Array([partID:0, val: 3], [partID:0, val: 6], [partID:0, val: 9], [partID:1, val: 1], [partID:1, val: 4], [partID:1, val: 7], [partID:2, val: 2], [partID:2, val: 5], [partID:2, val: 8])

coalesce
val rdd2 = rdd1.coalesce(3)
rdd2.mapPartitionsWithIndex(myfunc).collect
res7: Array[String] = Array([partID:0, val: 1], [partID:0, val: 2], [partID:0, val: 3], [partID:0, val: 4], [partID:1, val: 5], [partID:1, val: 6], [partID:1, val: 7], [partID:1, val: 8], [partID:1, val: 9])
val rdd2 = rdd1.coalesce(3,true)
rdd2.mapPartitionsWithIndex(myfunc).collect
res8: Array[String] = Array([partID:0, val: 3], [partID:0, val: 6], [partID:0, val: 9], [partID:1, val: 1], [partID:1, val: 4], [partID:1, val: 7], [partID:2, val: 2], [partID:2, val: 5], [partID:2, val: 8])

collectAsMap
val rdd = sc.parallelize(List(("a",1),("b",2)))
rdd.collectAsMap
res9: scala.collection.Map[String,Int] = Map(b -> 2, a -> 1)
rdd.collect
res10: Array[(String, Int)] = Array((a,1), (b,2))

countByKey,countByValue
val rdd1 = sc.parallelize(List(("a",1),("b",2),("b",2),("c",2),("c",2)))
rdd1.count
res11: Long = 5
rdd1.countByKey
res12: scala.collection.Map[String,Long] = Map(a -> 1, b -> 2, c -> 2)
rdd1.countByValue
res13: scala.collection.Map[(String, Int),Long] = Map((c,2) -> 2, (a,1) -> 1, (b,2) -> 2)

filterByRange
val rdd1 = sc.parallelize(List(("a",1),("e",5),("d",4),("c",2),("b",6),("c",3)))
rdd1.filterByRange("b","d").collect
res14: Array[(String, Int)] = Array((d,4), (c,2), (b,6), (c,3))

flatMapValues
val a = sc.parallelize(List(("a","1 2"),("b","3 4")))
a.flatMapValues(_.split(" ")).collect
res15: Array[(String, String)] = Array((a,1), (a,2), (b,3), (b,4))

foldByKey
val rdd1 = sc.parallelize(List("dog","wolf","cat","beer"),2)
rdd1.map(x => (x.length,x)).collect
res17: Array[(Int, String)] = Array((3,dog), (4,wolf), (3,cat), (4,beer))
val rdd2 = rdd1.map(x => (x.length,x))
rdd2.foldByKey("")(_+_).collect
res19: Array[(Int, String)] = Array((4,wolfbeer), (3,dogcat))

keyBy()
val rdd1 = sc.parallelize(List("dog","wolf","elephant","salmon"),3)
val rdd2 = rdd1.keyBy(_.length)
rdd2.collect
res21: Array[(Int, String)] = Array((3,dog), (4,wolf), (8,elephant), (6,salmon))
val rdd3 = rdd1.keyBy(_(0))
rdd3.collect
res22: Array[(Char, String)] = Array((d,dog), (w,wolf), (e,elephant), (s,salmon))

/////////\\\\\\\\

资源下载链接为: https://pan.quark.cn/s/d9ef5828b597 在本文中,我们将探讨如何通过 Vue.js 实现一个带有动画效果的“回到顶部”功能。Vue.js 是一款用于构建用户界面的流行 JavaScript 框架,其组件化和响应式设计让实现这种交互功能变得十分便捷。 首先,我们来分析 HTML 代码。在这个示例中,存在一个 ID 为 back-to-top 的 div 元素,其中包含两个 span 标签,分别显示“回到”和“顶部”文字。该 div 元素绑定了 Vue.js 的 @click 事件处理器 backToTop,用于处理点击事件,同时还绑定了 v-show 指令来控制按钮的显示与隐藏。v-cloak 指令的作用是在 Vue 实例渲染完成之前隐藏该元素,避免出现闪烁现象。 CSS 部分(backTop.css)主要负责样式设计。它首先清除了一些默认的边距和填充,对 html 和 body 进行了全屏布局,并设置了相对定位。.back-to-top 类则定义了“回到顶部”按钮的样式,包括其位置、圆角、阴影、填充以及悬停时背景颜色的变化。此外,与 v-cloak 相关的 CSS 确保在 Vue 实例加载过程中隐藏该元素。每个 .page 类代表一个页面,每个页面的高度设置为 400px,用于模拟多页面的滚动效果。 接下来是 JavaScript 部分(backTop.js)。在这里,我们创建了一个 Vue 实例。实例的 el 属性指定 Vue 将挂载到的 DOM 元素(#back-to-top)。data 对象中包含三个属性:backTopShow 用于控制按钮的显示状态;backTopAllow 用于防止用户快速连续点击;backSeconds 定义了回到顶部所需的时间;showPx 则规定了滚动多少像素后显示“回到顶部”按钮。 在 V
资源下载链接为: https://pan.quark.cn/s/9e7ef05254f8 以下是简化后的内容: 程序集变量 计数器:整数型 文本发送计次:整数型 子程序 __启动窗口_创建完毕 _手动发送数据_被单击 停止发送 发送预处理 判断端口是否启动成功,失败则提示并返回 根据组合框选择的进制类型,将编辑框内容转换后发送 发送失败则提示并返回 进制转换(被转换文本,被转换进制,转换的进制) 检查进制范围,错误则返回提示 规范参数,逐字符检查是否符合进制要求,不符合则返回错误提示 若进制相同直接返回原文本 否则进行进制转换并返回结果 _退出_被单击销毁 _组合框_端口号_列表项被选择 停止发送 设置端口号 _组合框_波特率_列表项被选择 停止发送 设置波特率 _组合框_数据位_列表项被选择 停止发送 设置数据位数 _组合框_校验_列表项被选择 停止发送 设置奇偶校验方案 _组合框_停止位_列表项被选择 停止发送 设置停止位数 发送预处理 停止发送 设置波特率、端口号、数据位数、奇偶校验方案、停止位数 根据奇偶校验方案设置校验标志 _选择框_DTR_被单击 根据选中状态设置信号操作 _选择框_RTS_被单击 根据选中状态设置信号操作 _选择框_Break_被单击 根据选中状态设置信号操作 _编辑框_发送周期_内容被改变 若时钟标志选中,设置时钟周期 _选择框_时钟标志_被单击 若选中,设置发送方式为时钟模式,启动发送并设置时钟周期 否则,停止发送,设置时钟周期为0 _组合框_发送方式_列表项被选择 根据选择设置时钟标志和时钟周期 _端口_发送数据_收到信号 _端口_接收数据_收到信号 _端口_接收数据_数据到达 根据接收数据的进制选择,将数据转换后显示在编辑框中 _时钟1_周期事件 根据发送方式和进制选择,周期性发送数据 打开并读入文件 打开文件,读取内容到编辑框 _打开
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值