Exceeded checkpoint tolerable failure threshould【记一次flink上线异常】

在部署Flink程序后,遇到一分钟后任务挂起的问题,检查日志显示checkpoint超时。首先调整checkpoint超时时间,但问题依旧,checkpoint状态持续为IN_PROGRESS。进一步排查发现是由于忘记关闭数据库连接,导致资源占用,任务卡住。在预生产环境中,大量数据触发了该问题。修复代码并重新上线后,checkpoint恢复正常。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近完成一个业务需求,flink程序上线之后,跑了不到一分钟就挂了,查看日志,报错如下:

org.apache.flink.util.FlinkRuntimeException: Exceeded checkpoint tolerable failure threshold.
        at org.apache.flink.runtime....

在这里插入图片描述
明显,checkpoint超时了,于是,我下意识地去检查checkpoint的设置,
代码中的设置如下:

        
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值