扫一扫加入大数据公众号和技术交流群,了解更多大数据技术,还有免费资料等你哦
简介
Flink的Accumulators(累加器)相比spark的累加器,使用起来是非常简单的。通过一个add操作累加最终的结果,在flink任务执行完可以获取最终结果,通过累加器我们可以获取flink任务某些指标的全局值,没有累加器你只能获取单个分区的值,所以累加器在调试程序或者更快了解你的flink任务运行数据的时候是非常有用的。
使用步骤
第一步:创建
在你需要使用累加器的transformation算子中创建你的累加器,并给累加器命名,累加器的名称是全局唯一的。另外transformation算子最好是RichFunction,比如在RichMapFunction中创建一个累加器对象(
本文详细介绍了Flink累加器的使用步骤,包括创建、注册和使用,并强调了注意事项。通过实例展示了如何统计Map算子中成功读取HDFS文件的行数,同时提到了自定义累加器的实现方式。利用累加器,可以在Flink任务执行后获取全局指标值,方便调试和理解任务运行情况。

订阅专栏 解锁全文
4277

被折叠的 条评论
为什么被折叠?



