
Flink
文章平均质量分 81
D愿你归来仍是少年
这个作者很懒,什么都没留下…
展开
-
基于Python脚本实现Flink on YARN任务批量触发Savepoint的实践指南
在流计算生产环境中,Flink on YARN的部署方式凭借其资源管理优势被广泛采用。Savepoint作为Flink任务状态的一致性快照,承载着故障恢复、版本升级、作业暂停等重要场景的核心保障。当集群中运行数十个Flink作业时,手动逐个触发Savepoint耗时且易出错。本文提出一种基于Python脚本的批量化操作方案,可显著提升运维效率。原创 2025-04-08 09:57:40 · 906 阅读 · 0 评论 -
Flink API 解析 Flink Job 依赖的checkpoint 路径
Flink API 解析 Checkpoint _metadata 中依赖的元数据路径原创 2025-02-24 11:48:13 · 204 阅读 · 0 评论 -
Python解析 Flink Job 依赖的checkpoint 路径
Python 解析 Flink _metadata 文件原创 2025-02-21 14:45:55 · 846 阅读 · 0 评论 -
RocksDB Bloom Filter 如何避免假阳性问题探索
对于 Flink 等大数据应用,合理配置 Bloom Filter 参数并监控其有效性,可大幅降低状态查询延迟,提升吞吐量。(False Positive):当 Bloom Filter 认为键存在时,实际可能不存在,这会导致无效的磁盘 I/O,影响查询性能。当键包含时间戳时,RocksDB 会在比较中剥离时间戳,仅基于用户键(User Key)判断逻辑存在性,避免因时间戳版本导致的误判。然而,其核心缺陷是存在。原创 2025-02-21 09:25:32 · 834 阅读 · 0 评论