Flink 再谈State Backends

在大数据处理中,状态管理至关重要。未开启Checkpoint时,状态由MemoryStateBackend管理,易因资源不足导致slot容器重启。开启Checkpoint并使用RocksDBStateBackend可显著减少重启,因其直接将状态写入TaskManager的文件目录,减少内存负担。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近做数据统计时候,在做大状态数据管理时候,发现问题。

因为大状态,我没开checkpoint。申请了6个容器资源,但半小时内就出现slot container丢失,重启。
每隔半小时重启,但开了(ck)checkpoint,采用RocksDBS发现很少出先slot丢失重启。
一直不明白,开始以为ck会消耗性能,没开CK为什么会经常重启。
问了相关人员、查了相关文档才明白。

没开启ck的时候,状态管理都是在MemoryStateBackend,所以6个容器会把一定state资源放在内存里,进行状态管理。
所以,slot容器因为资源不够、维护状态,容易造成失去心跳假死状态。

FsStateBackend 是先把状态写在内存中,再当ck时候,写到hdfs路径。这是最占用资源的。

RocksDBStateBackend 是把state直接写到TaskManager的文件目录下,没有占用内存资源,所以slot丢失很少出现。

一般在做大状态管理,还是首先推荐RocksDBStateBackend

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值