包括Spark Streaming在内的实时计算数据可靠性指的是三种级别:
1. At most once,数据最多只能接受一次,有可能接收不到
2. At least once, 数据至少接受一次,有可能重复接收
3. Exactly once 数据保证被处理并且只被处理一次,
具体的多读几遍http://spark.apache.org/docs/latest/streaming-kafka-integration.html吧,实在不想总结整理了
本文介绍了Spark Streaming中数据处理的三个可靠性级别:Atmostonce、Atleastonce和Exactlyonce,并解释了它们之间的区别。Atmostonce确保数据最多处理一次,但可能会丢失数据;Atleastonce确保数据至少处理一次,但可能会重复处理;Exactlyonce则确保数据恰好处理一次。
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别:
1. At most once,数据最多只能接受一次,有可能接收不到
2. At least once, 数据至少接受一次,有可能重复接收
3. Exactly once 数据保证被处理并且只被处理一次,
具体的多读几遍http://spark.apache.org/docs/latest/streaming-kafka-integration.html吧,实在不想总结整理了
3919

被折叠的 条评论
为什么被折叠?