1.累加器介绍
累加器(Accumulator)是一种只能通过关联操作进行“加”操作的变量,因此具有高效的并行计算能力。
2.简单累加器创建步骤
1.首先,通过accumulator(v)方法创建Accumulator并初始化为0
val accum = sc.accumulator(0)
2.然后,通过运算符+= 进行累加操作
x => accum+=x
3.通过value方法读取累加器的值accum.value
3.完整代码及结果
val accum = sc.accumulator(0)
sc.parallelize(Array(1,2,3,4)).foreach(x => accum+=x)
println(accum.value) // 10

本文介绍了Spark累加器Accumulator的概念,详细阐述了创建累加器的步骤,并提供了一个实际案例——通过累加器统计README.md文件中的空白行数量,包括代码实现和结果展示。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



