
1.概述
首先说说我对flink key state 多年的误解。以前我一直以为key State是类似这样的
假设数据如上,我原先以为当数据经过key的时候,流经下游的时候,数据是在下游根据key分组,如果key不存在,那么就增加一个key,如果存在,那么就放到一起,然后计算存储一个state,因此key state 每个不同的key之间是隔离的。
我这里错误的理解每个key在每个算子的每个并行度的task上,都会有一份或者平分,key1在并行度1上,key2在并行度2上。
这里这样理解有错误的,可以参考文章:【Flink】Flink Key State 和 Operator State 区别
或者参考视频: