1.什么是Flink的非barrier对齐,如何实现?
2.flink的内存管理?
3.flink的序列化机制?
4.flink提交job的方式以及参数如何设置? 页面提交和客户端提交有什么区别?
5.你们flink集群规模?
6.flink提交作业的流程,以及与yarn是如何交互的?
7.flink的checkpoint机制以及精准一次性消费如何实现?
8.flink的状态是什么,分为几种?
9.SparkContext里面主要做了哪些工作?
10.ConcurrentHashMap的底层实现原理?
11.什么是Watermark及主要作用?
12.flink是如何管理kakfa的offset,使用什么类型的状态保存offset?
2022最新大数据面试题之米哈游
最新推荐文章于 2025-10-23 17:25:00 发布
本文将深入探讨Flink的非barrier对齐实现、内存优化策略、序列化技术、作业提交方式及其参数设置、集群规模、作业提交流程与YARN交互、checkpoint机制、状态管理以及与Spark的区别。同时涉及Kafka offset管理、状态类型和关键概念如Watermark。
948

被折叠的 条评论
为什么被折叠?



