本文主要记录生产环境短暂停机升级RocketMQ版本的过程
一、整体思路
1.将生产环境MQ4.9.2集群同步到测试环境,并启动,确保正常运行。
2.参照4.9.2配置4.9.6集群
3.停掉4.9.2集群,启动4.9.6集群,测试确保正常运行。
4.停掉4.9.6集群,复制4.9.2集群的store存储文件夹到4.9.6,再次启动观察有无异常,Topic及历史消息是否可以正常查询和使用。
5.停掉4.9.6集群,再启动4.9.2集群,确保两个版本的集群都正常可用,无异常,目的是保证都可用,再生产机器升级遇到问题时可以及时切回老版本,不至于长时间停机影响业务。
6.生产环境备份4.9.2集群
7.生产环境配置4.9.6集群(参照测试环境配置过程)
8.生产环境停机4.9.2集群,复制store存储目录到4.9.6集群,启动4.9.6集群,并测试4.9.6有无异常。
注意:1-5步骤在测试机器进行,重点是验证升级思路及可行性,避免在生产环境升级时遇到问题不能及时解决导致消息队列长时间停机。6-8步骤在生产环境进行,第8步骤生产MQ停机约在10分钟左右。
二、实际操作(生产环境单机双主双从异步集群)
1.上传4.9.6mq程序包并解压
2.调整/rocketmq-4.9.6/bin目录下runserver.sh、runbroker.sh里的JVM内存参数(参照4.9.2版本的JV