RocketMQ介绍（一）——RocketMQ简介

liitdar

已于 2024-05-31 16:25:00 修改

阅读量1.5k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：网络通信文章标签：消息队列 RocketMQ

于 2019-02-26 09:11:42 首次发布

本文链接：https://blog.youkuaiyun.com/liitdar/article/details/87928598

网络通信专栏收录该内容

33 篇文章

订阅专栏

本文深入探讨RocketMQ的分布式消息处理能力，包括低延迟、高并发、可靠性和灵活性。介绍了RocketMQ相较于ActiveMQ和Kafka的优势，如严格的消息顺序、亿级消息堆积能力和多种消息消费模式。同时，阐述了RocketMQ的集群部署模式，如多Master多Slave的高可用性方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本系列文章主要介绍RocketMQ的相关知识，并通过示例代码介绍RocketMQ的使用方法。

本文为系列文章的第一篇，主要介绍RocketMQ的概要知识。

说明：本文的部分内容参考了RocketMQ实战（一） - 简书文章的相关内容。

1 概述

首先，给出GitHub上对于RocketMQ项目的描述，内容如下：

Apache RocketMQ is a distributed messaging and streaming platform with low latency, high performance and reliability, trillion-level capacity and flexible scalability.

It offers a variety of features:

Pub/Sub messaging model
Scheduled message delivery
Message retroactivity by time or offset
Log hub for streaming
Big data integration
Reliable FIFO and strict ordered messaging in the same queue
Efficient pull&push consumption model
Million-level message accumulation capacity in a single queue
Multiple messaging protocols like JMS and OpenMessaging
Flexible distributed scale-out deployment architecture
Lightning-fast batch message exchange system
Various message filter mechanics such as SQL and Tag
Docker images for isolated testing and cloud isolated clusters
Feature-rich administrative dashboard for configuration, metrics and monitoring

RocketMQ作为一款分布式的消息中间件，经历了Metaq1.x、Metaq2.x的发展和淘宝双十一的洗礼，证明其在功能和性能上远超ActiveMQ。GitHub上关于RocketMQ诞生的原因中，也说明了随着交易量的大幅度增长，ActiveMQ到达了性能瓶颈，而其他流行的消息解决方案（如Kafka）都不能满足其需求的情况下，才诞生了RocketMQ。

RocketMQ的优点如下：

RocketMQ原生就是支持分布式的，而ActiveMQ原生为单点性；
RocketMQ可以保证严格的消息顺序，而ActiveMQ无法保证；
RocketMQ提供亿级消息的堆积能力，这不是重点，重点是堆积了亿级的消息后，依然保持写入低延迟；
丰富的消息拉取模式（Push or Pull）。Push模式好理解，比如在消费者端设置Listener回调；而Pull模式，控制权在于消费者，即消费者需要主动地调用拉消息方法从Broker获取消息，这里面就存在一个消费位置记录的问题（如果不记录，会导致消息重复消费）；
在Metaq1.x/2.x的版本中，分布式协调采用的是Zookeeper，而RocketMQ自己实现了一个NameServer，这使得RocketMQ的分布式架构更加轻量级，性能更好；
消息失败重试机制、高效的订阅者水平扩展能力、强大的API、事务机制。

2 Producer/Consumer Group

ActiveMQ中并没有Group这个概念，而在RocketMQ中存在Group机制，理解该机制对于深入理解RocketMQ非常重要。

RocketMQ通过Group机制，天然地支持了消息负载均衡。例如，某个Topic有9条消息，其中一个Consumer Group有3个实例（3个进程/3台机器），那么每个实例将均摊3条消息，由此实现了负载均衡。（注意：RocketMQ只有一种模式，即发布订阅模式）

3 集群模式

RocketMQ有多种Broker集群部署模式，常见的包括：单Master模式、多Master模式、多Master多Slave模式（异步复制）、多Master多Slave模式（同步双写）等。这里需要强调一下：RocketMQ的Slave只能被消费者读取，不可以被生产者写入，类似于MySQL的主从机制。下面分别介绍这几种Broker集群部署模式。

3.1 单Master模式

很显然，单Master模式部署风险较大，一旦这个Broker重启或宕机，会导致整个服务不可用，通常线上环境都不会使用此模式。

3.2 多Master模式

集群中全是Master，没有Slave，例如2个Master或3个Master。此时，如果某一个Broker重启或宕机，对应用是无影响的。此模式的缺点在于，当某个Master宕机时，该Master上未被消费的消息在Master恢复之前是不可以订阅的，消息的实时性会受到影响。

3.3 多Master多Slave模式（异步复制）

此模式下，有多个Master，每个Master会配置一个或多个Slave，由此实现了系统的高可用性。同时，Master与Slave之间的消息同步，采用异步复制的方式，主备之间会短暂的消息延迟，这种延迟是ms级别的。如果Master宕机，消费者可以从Slave上进行消息消费，不影响消息实时性，但是由于Master的宕机，会导致丢失掉极少量（尚未同步到Slave上）的消息。

3.4 多Master多Slave模式（同步双写）

此模式下，有多个Master，每个Master会配置一个或多个Slave，由此实现了系统的高可用性。同时，Master与Slave之间的消息同步，采用同步双写的方式，也就是在Master和Slave都写成功的前提下，才会向应用（生产者）返回成功。显然，此种模式下，无论是数据还是服务都不是单点的，所以服务与数据的可用性都非常高。此模式的缺点在于，性能会比异步复制稍低。

多Master多Slave模式的部署架构图，如下所示：

4 RocketMQ vs ActiveMQ vs Kafka

下面给出一张RocketMQ、ActiveMQ和Kafka的技术和特性的对比表，内容如下：

Messaging Product	Client SDK	Protocol and Specification	Ordered Message	Scheduled Message	Batched Message	BroadCast Message	Message Filter	Server Triggered Redelivery	Message Storage	Message Retroactive	Message Priority	High Availability and Failover	Message Track	Configuration	Management and Operation Tools
ActiveMQ	Java, .NET, C++ etc.	Push model, support OpenWire, STOMP, AMQP, MQTT, JMS	Exclusive Consumer or Exclusive Queues can ensure ordering	Supported	Not Supported	Supported	Supported	Not Supported	Supports very fast persistence using JDBC along with a high performance journal，such as levelDB, kahaDB	Supported	Supported	Supported, depending on storage,if using kahadb it requires a ZooKeeper server	Not Supported	The default configuration is low level, user need to optimize the configuration parameters	Supported
Kafka	Java, Scala etc.	Pull model, support TCP	Ensure ordering of messages within a partition	Not Supported	Supported, with async producer	Not Supported	Supported, you can use Kafka Streams to filter messages	Not Supported	High performance file storage	Supported offset indicate	Not Supported	Supported, requires a ZooKeeper server	Not Supported	Kafka uses key-value pairs format for configuration. These values can be supplied either from a file or programmatically.	Supported, use terminal command to expose core metrics
RocketMQ	Java, C++, Go	Pull model, support TCP, JMS, OpenMessaging	Ensure strict ordering of messages,and can scale out gracefully	Supported	Supported, with sync mode to avoid message loss	Supported	Supported, property filter expressions based on SQL92	Supported	High performance and low latency file storage	Supported timestamp and offset two indicates	Not Supported	Supported, Master-Slave model, without another kit	Supported	Work out of box,user only need to pay attention to a few configurations	Supported, rich web and terminal command to expose core metrics

5 Pull&Push模式

首先介绍一下Push和Pull两种消费模式，内容如下：

Push模式：由消息中间件（MQ消息服务器代理）主动地将消息推送给消费者。采用Push方式的情况下，broker可以尽可能实时地将消息发送给消费者进行消费，但是，在消费者处理消息的能力较弱时（比如消费者端的业务系统处理一条消息的流程比较复杂、其中的调用链路比较多导致消费时间比较久，概括起来就是“慢消费问题”），broker不断地向消费者Push消息，会导致消费者端的缓冲区溢出，从而产生异常；
Pull模式：由消费者主动向消息中间件（MQ消息服务器代理）拉取消息。采用Pull方式时，重点是如何设置Pull消息的频率。例如，生产者可能在1分钟内连续生产了1000条消息，然后2小时内没有新消息产生，在这种情况下，如果每次Pull的时间间隔比较久，就会增加消息的延迟，即消息到达消费者的时间会加长，MQ中消息的堆积量变大；反之，如果每次Pull的时间间隔较短，但是在一段时间内MQ中并没有任何消息可以消费，那么又会产生很多无效的Pull请求的RPC开销，影响MQ整体的网络性能（即“消息延迟与忙等待”）。

介绍完一般的Push与Pull消费方式后，再来看一下RocketMQ的这两种消费方式，内容如下：

RocketMQ的Pull方式下，Consumer主动获取MessageQueue的Set（集合），遍历该集合中的每一个队列，发送Pull的请求（参数中带有队列中的消息偏移量），同时需要Consumer端自己保存消息消费的offset（偏移量）至本地变量中。由此可见，在Pull模式下，需要业务应用自身去完成比较多的事情，所以在实际应用中，Pull方式用的较少；
RocketMQ的Push方式下，Consumer注册了一个监听器，当Consumer收到消息时，会主动调用这个监听器完成消费，并进行相关的业务逻辑处理。由此可见，在Push方式下，业务应用代码只需要完成消息消费的代码逻辑即可，无需参与MQ本身的一些任务处理。

说明：RocketMQ的Push方式本质上也属于Pull方式，因为当Consumer从broker成功获取到消息后，Consumer需要调用监听器，主动去broker轮询拉取消息完成消费。这种Push方式既解决了普通的Push方式的“慢消费问题”，同时相对于纯Pull模式来说，在代码实现上又简单了许多。

正如上面的说明所述，RocketMQ的消费方式（Pull方式和Push方式）本质上都是基于Pull方式的，即都是采用consumer轮询从broker拉取消息。而在轮询过程中，加入了一种长轮询机制（对普通轮询的一种优化），来平衡Push/Pull模型的各自缺点。长轮询机制的基本设计思路是：消费者如果第一次尝试Pull消息失败（如Broker端没有可以消费的消息），Broker并不立即给消费者客户端返回Response响应消息，而是先hold并挂起该请求（将请求保存至pullRequestTable本地缓存变量中），然后Broker端的后台独立线程PullRequestHoldService会从pullRequestTable本地缓存变量中不断地去取，具体的做法是查询待拉取消息的偏移量是否小于消费队列最大偏移量，如果条件成立则说明有新消息达到Broker端（这里，在RocketMQ的Broker端会有一个后台独立线程ReputMessageService不停地构建ConsumeQueue/IndexFile数据，同时取出hold住的请求并进行二次处理），则通过重新调用一次业务处理器PullMessageProcessor的处理请求方法processRequest()，来重新尝试拉取消息（此处，每隔5s重试一次，默认长轮询整体的时间设置为30s）。

RocketMQ使用的这种长轮询机制（Pull方式和Push方式都具有），解决了一般的Push方式的“慢消费问题”，同时，解决了一般的Pull方式的“消息延迟与忙等待问题”，并且，使用RocketMQ的Push机制，还可以减小消费者端的代码逻辑复杂度，所以RocketMQ的Push方式同时具有三个优点。

综上所述，在实际应用中，我们一般会采用RocketMQ的Push方式进行消息消费。

关于RocketMQ具体的部署方法，请参考本系列文章的第二篇。