11 月 18 日,我们迎来了首场线上盛会—《RocketMQ 运维经验圆桌交流会》,本次交流会汇聚了 RocketMQ 的作者,腾讯云、移动云的技术专家,《RocketMQ 实战》的作者等技术大咖,共同深度探讨了 RocketMQ 运维中的挑战与解决方案。线上参会者们通过连线提问的方式积极参与,交流了 RocketMQ 运维中的一些疑难问题。技术专家们不仅详细解答了每一个问题,还分享了许多实际案例,为大家揭开了 RocketMQ 运维中的种种谜团。线上探讨氛围热烈,下面就让我们来回顾本次会议的精彩内容。
RocketMQ 运维中的监控性能
腾讯**云 RocketMQ 技**术专家雷志远老师主要分享了腾讯云基于 RocketMQ 4.0 构建可观测性和监控设施的经验,志远老师首先指出了开源社区 Exporter 组件在大规模场景下的一些不足:当 Topic 和 Group 元数据规模较大时,Exporter 组件会出现性能瓶颈。功能上,Exporter 不支持 Topic 和 Group 组合指标,也缺少一些精细化的指标比如 Topic 级的存储用量。为了解决上述问题,腾讯云针对 RocketMQ 4.0 提出了基于日志异步转 Promethus 的方案来支撑了腾讯云大规模的 RocketMQ 消息业务。随后,Apache RocketMQ 的 PMC 成员艾阳坤老师表示 RocketMQ 5.0 在原生支持 Promethus 的基础上,还丰富了大量的指标,希望开发者可以进行体验。
RocketMQ 故障排查的导论
移动云消息中间件研发负责人胡宗棠老师分享了他在故障排查和生产场景应用方面的专业经验。他强调了故障源头问题,包括开源用户对 RocketMQ 的不全面监控和在