flink流计算 分为有状态和无状态。
无状态
比较好理解,就是流中的事件相互独立,流只看最后到达的数据状态,作为最新状态。
而不考虑之前到达的数据的情况。
比如:水库水位只接收传感器最后的水位高度,作为最后状态
有状态
根据
在离线的批处理的作业中,往往都是对数据进行切片计算,最后再把结果聚合,所以对数据状态要求不高。
但是实时流数据中数据状态就很重要了。
flink中状态
eg:
比较好理解,就是流中的事件相互独立,流只看最后到达的数据状态,作为最新状态。
而不考虑之前到达的数据的情况。
比如:水库水位只接收传感器最后的水位高度,作为最后状态
根据
在离线的批处理的作业中,往往都是对数据进行切片计算,最后再把结果聚合,所以对数据状态要求不高。
但是实时流数据中数据状态就很重要了。
eg: