背景 :
最近我们再用RocketMq 做消息消费 总结一下消费监控打点问题
rmq 消费监控 我们需要关注 发送了多少消息 ,然后 消费了多少 ,还有失败重试了多少次 (需要加报警)这几个点, 去整体的看一个消费者的消费情况
消费lag 的情况
1,消息发送
如果是自己是发送方最好自己在发送的时候上报打点
2.消息消费
消费入口上报
3.消息失败
代码里tryCatch catch 里打点 并且要返回 LATER
返回LATER 消息会重试
4.消息lag
一些业务时效性敏感的 需要重点关注消息延迟时间
5.消息失败重试次数
rocketMq 是支持消息重试的 一共16 次 每次时间间隔不一样

在业务执行过程中可能有些网络抖动或者发布的case 导致消费失败,那消费失败的消息 我们应该要进行重试
如果我们失败次数过多 就需要我们去立刻看到底是什么原因导致消费失败
6, 业务异常
这个就需要取决于业务
比如业务是需要更新一个商品的es 数据结果在消息体里 根据商品id 没有查到 商品数据,那这个时候 代码需要返回SUCCESS 还是返回LATER
也就是说是否要重试
本文概述了在使用RocketMq时如何监控消息发送、消费、失败重试以及消费延迟,强调了业务异常处理和设置报警的重要性。通过实例讲解了如何在代码中实现打点和重试策略,以确保高效和及时的监控和问题排查。
1205

被折叠的 条评论
为什么被折叠?



