状态编程(按键分区状态 Keyed State)_enabletimetolive在哪个方法中使用-优快云博客

本文链接：https://blog.youkuaiyun.com/2301_77578187/article/details/135865247

本文详细介绍了Flink中的KeyedState，包括其基本概念、特点，以及ValueState、ListState、MapState、ReducingState和AggregatingState等状态类型。同时讨论了状态生存时间（TTL）的配置和应用，帮助开发者更好地管理流处理任务中的状态。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

状态编程

按键分区状态（Keyed State）

在实际应用中，分区通常是处理流数据的关键步骤，因为通过将数据按照特定的键进行分区，我们可以将相关的数据聚集在一起，以便进行高效的计算和处理。因此，Keyed State 成为最常用的状态类型。在 Flink 中，当我们使用 keyBy() 函数对数据进行分区后，所进行的聚合、窗口计算等操作，其算子所持有的状态都是 Keyed State。

此外，Flink 还提供了富函数类（Rich Function），允许我们对转换算子进行扩展和自定义。例如，通过 RichMapFunction 和 RichFilterFunction，我们可以在算子上添加额外的功能。在富函数中，我们可以调用 getRuntimeContext() 方法获取当前的运行时上下文（RuntimeContext），进而获取到访问状态的句柄。这种在富函数中自定义的状态也是 Keyed State。

1.基本概念和特点

按键分区状态（Keyed State）是指任务按照键（key）来访问和管理的状态。这种状态的特点在于，它以键的作用范围进行隔离。在按键分区之后，具有相同键的所有数据都会被分配到同一个并行子任务中。因此，如果任务定义了状态，Flink 会在当前并行子任务实例中，为每个键值维护一个状态实例。这样，任务就可以为分配来的所有数据，按照键维护和处理对应的状态。

在底层实现上，Keyed State 类似于一个分布式的映射（map）数据结构。所有的状态都以键值对（key-value）的形式保存，并根据键进行组织。当数据到来时，任务会自动将状态的访问范围限定为当前数据的键，从映射存储中读取对应的状态值。因此，具有相同键的所有数据都会访问到相同的状态，而不同键的状态之间是相互隔离的。

需要注意的是，要使用 Keyed State，必须基于 KeyedStream。如果 DataStream 没有进行键分区，即使转换算子实现了对应的富函数类，也无法通过运行时上下文访问 Keyed State。因此，在进行流处理任务时，需要根据具体的需求选择合适的分区策略，并正