在分布式系统中,构成系统的任何节点都是被定义为可以彼此独立失败的。比如在Kafka中,broker可能会宕机,在Producer推送数据至Topic的过程中也可能会遇到网络问题。
根据producer处理此类故障所采取的提交策略类型有以下三种:
语义类别 |
原理 |
备注 |
---|---|---|
At-most-once |
至多一次,可能导致消息丢失,如果Producer收到来自kafka broker的确认(ack)或者acks=all,则表示该消息已经写入了kafka。但如果producer ack超时或收到错误,则可能会重新发送消息,客户端会认为该消息未写入Kafka。如果Broker在发送Ack之前失败,但在消息成功写入Kafka之后,此重试将导致该消息被写入两次,因此消息会被不止一次地传递给最终consumer,这种策略可能导致重复的工作和不正确的结果。 | |
At-least-once |
至少一次,可能导致消息重复,如果在ack超时或返回错误时producer不重试,则该消息可能最终不会写入kafka,因此不会传递给consumer。在大多数情况下, |