03 | Flink是如何实现Exactly-Once端到端一致性的

原创于 2025-11-17 16:02:05 发布 · 600 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#flink #大数据

Flink 专栏收录该内容

7 篇文章

订阅专栏

面试官您好，Flink 实现 端到端 Exactly-Once 一致性（End-to-End Exactly-Once）是一个系统性工程，它不仅保证 Flink 内部状态处理的精确一次，还确保 从数据源（Source）到外部存储（Sink）整个链路 的结果不重不丢。

核心思路是：“内部靠 Checkpoint + 外部靠事务/幂等”。下面我分三部分说明：

✅ 一、前提条件

要实现端到端 Exactly-Once，需满足：

Source 可重放：如 Kafka、Pulsar 支持按 offset 重新消费；
Sink 支持幂等写入或事务写入；
Flink 开启 Checkpoint（通常是 Barrier 对齐模式）；
业务逻辑无副作用（纯函数式处理）。

✅ 二、Flink 内部：Exactly-Once 状态一致性（通过 Checkpoint）

Flink 使用 分布式快照（Checkpoint） 机制保证内部状态的一致性：

Barrier 注入：JobManager 触发 Checkpoint，Source 注入 barrier 到数据流；
Barrier 对齐（在 Exactly-Once 模式下）：
- 某个算子收到某个输入流的 barrier 后，会暂停处理该流，等待其他流的 barrier；
- 所有 barrier 到齐后，才将状态快照保存，并向下游转发 barrier；
原子性保存：所有算子的状态 + Source 的 offset 被原子性地持久化到分布式存储（如 HDFS）；
故障恢复：从最近成功的 Checkpoint 恢复，重放 Source 数据，避免重复或丢失。

🔑 这保证了 Flink 内部状态 = 每条数据恰好处理一次的结果。

✅ 三、端到端：与外部系统协同（关键在 Sink）

仅内部 Exactly-Once 不够！如果 Sink 在故障前已写入外部系统，恢复后又重写，就会重复。
Flink 通过 两阶段提交（Two-Phase Commit, 2PC） 解决这个问题。

📌 核心组件：`TwoPhaseCommitSinkFunction`

Flink 提供该抽象类，要求 Sink 实现四个方法：

阶段	方法	作用
1. 预提交（Pre-commit）	`snapshotState()`	在 Checkpoint 时，将当前批次数据预写入临时位置（如临时文件、事务中）
2. 正式提交（Commit）	`commit()`	当 Checkpoint 全局成功后，真正提交预写的数据（如 rename 文件、commit 事务）
3. 回滚（Abort）	`abort()`	若 Checkpoint 失败，丢弃预写数据
4. 恢复（Recover）	`recoverAndCommit()`	作业恢复时，对未完成的事务进行补提交

🌰 典型场景：Flink + Kafka + MySQL

Source：Kafka（可重放）
Sink：MySQL（通过事务实现 2PC）
- 预提交：开启数据库事务，写入数据但不 commit；
- 正式提交：Checkpoint 成功后，执行 COMMIT；
- 若失败：事务自动回滚，无脏数据。

💡 对于不支持事务的系统（如 Elasticsearch），可通过 幂等写入（如用 ID 做主键覆盖）模拟 Exactly-Once。

✅ 四、总结流程图

[Kafka] 
   ↓ (消费 offset=100)
[Flink Job]
   ├─ 处理数据 → 更新内部状态
   └─ 预提交：将结果写入 Sink 临时区（事务中）
   ↓
Checkpoint 成功？
   ├─ 是 → 正式提交 Sink（commit 事务）
   └─ 否 → 回滚 Sink（abort 事务），从 offset=100 重放