当前位置：首页 > news >正文

RocketMQ的Rebalance原理：从源码到实战，吃透分布式消费负载均衡

news 2026/4/12 1:15:57

大家好，今天我们深入拆解 RocketMQ的核心机制之一——Rebalance（重平衡）。作为分布式消息队列中“消费负载均衡”的灵魂，Rebalance直接决定了消费者集群的吞吐量、资源利用率与高可用性。很多开发者在使用RocketMQ时，常会遇到“消费不均”“单点过载”“扩容后消费不生效”等问题，本质上都是对Rebalance原理理解不透彻。

本文将从「基础认知→核心原理→源码深挖→实战运用→编程实战→问题排查」六个维度，全方位解析Rebalance，既讲清楚“是什么、为什么”，也教你“怎么用、怎么调”，全程结合底层源码与生产实战场景，让你从根源上吃透这一核心技术。

一、Rebalance核心认知：先搞懂“为什么需要它”

1.1 什么是RocketMQ Rebalance？

Rebalance（重平衡）是RocketMQ中消费者集群的负载均衡机制，核心定义是：当消费者组（Consumer Group）中消费者数量发生变化、或订阅的Topic队列数发生变化时，重新分配消费者与消息队列（Message Queue）的对应关系，确保队列资源被均匀利用，避免单点消费瓶颈或资源浪费。

简单来说，Rebalance就是“给消费者集群分活”—— 把Topic下的多个队列，合理分配给组内的每个消费者，让每个消费者都能承担适量的消费任务，实现分布式并行消费。

1.2 核心目标与适用场景

Rebalance的三大核心目标：

均匀分配：让组内每个消费者分配到的队列数量尽可能均衡，避免部分消费者空闲、部分消费者过载；
高可用：当某个消费者宕机、下线或新增消费者时，快速重新分配队列，确保消费不中断；
一致性：所有消费者对队列的分配结果达成一致，避免重复消费（同一队列同一时间仅被一个消费者消费）或漏消费。

适用场景：仅针对「集群消费模式」（Clustering），广播模式（Broadcasting）下每个消费者都会消费全量队列，无需Rebalance。

1.3 核心约束

理解Rebalance的前提，必须记住两个核心约束（RocketMQ源码层面强制保证）：

一个消息队列（Message Queue）在同一时刻，只能被一个消费者组内的一个消费者消费；
一个消费者可以同时消费多个消息队列（数量由分配策略决定）；
队列数 ≥ 消费者数，否则会有消费者空闲，无法发挥集群消费的优势。

二、Rebalance核心原理：触发时机、流程与分配策略

Rebalance的核心逻辑可以概括为：「触发条件→获取元数据→执行分配策略→更新消费关系」，其中“分配策略”是核心，“触发时机”决定了Rebalance的触发频率，两者共同影响消费性能。

2.1 Rebalance触发时机（4种核心场景）

Rebalance不会一直执行，仅在以下4种场景下触发（源码中对应不同的事件回调），其中前3种是主动触发，第4种是兜底触发：

消费者数量变化

新消费者启动并加入消费组（调用consumer.start()）；
消费者宕机、主动关闭（调用consumer.shutdown()）或心跳超时（默认30秒未上报心跳，Broker标记其下线）；

示例代码触发场景：

// 新消费者加入，触发Rebalance DefaultMQPushConsumer consumer = new DefaultMQPushConsumer(“order_group”); consumer.subscribe(“order_topic”, “*”); consumer.start(); // 启动时触发首次Rebalance // 消费者下线，触发Rebalance consumer.shutdown();

2. Topic队列数变化

通过mqAdmin工具扩容/缩容Topic队列（如从8个扩到16个）；
示例：mqAdmin.createTopic(“order_topic”, 16); // 队列扩容，触发Rebalance

3. 消费者重启（本质是“下线→上线”的两次触发）

消费者重启时，先触发一次“下线Rebalance”，重启完成后触发一次“上线Rebalance”；

4. 定期触发（兜底机制）

消费者内部有一个定时任务（RebalanceService），默认每20秒执行一次Rebalance，确保分配关系的一致性（避免因网络延迟、元数据同步滞后导致的分配不均）；
定时周期可通过配置调整：consumer.setRebalanceInterval(60000); // 改为60秒触发一次

2.2 Rebalance核心流程

无论哪种触发时机，Rebalance的执行流程完全一致，全程在消费者客户端完成（RocketMQ的Rebalance是客户端自主计算，无需Broker协调，这与Kafka的服务端协调有本质区别），流程如下：

获取元数据：消费者从NameServer获取订阅Topic的所有队列信息（MessageQueue列表），以及当前消费者组内的所有在线消费者信息（ClientID列表）；
筛选可用资源：过滤掉不可用的队列（如Broker宕机对应的队列）和离线消费者（心跳超时的消费者）；
执行分配策略：根据配置的分配策略（默认平均分配），计算当前消费者应分配到的队列列表；
更新消费关系：将计算出的队列列表与当前消费者正在消费的队列列表对比，新增需消费的队列、移除无需消费的队列；
触发消息拉取：对新增的队列，启动消息拉取任务（PullMessageService），开始消费；对移除的队列，停止拉取并提交消费进度。

关键点：RocketMQ的Rebalance是“去中心化”设计，无需Broker集中协调，每个消费者独立计算分配结果，通过定时任务兜底保证一致性，避免了Kafka重平衡的全局停顿问题。

2.3 核心分配策略

分配策略是Rebalance的核心，RocketMQ提供了4种内置策略（实现AllocateMessageQueueStrategy接口），可通过代码配置指定，默认使用“平均分配策略”。每种策略对应不同的业务场景，需根据队列数、消费者数灵活选择。

（1）平均分配策略（AllocateMessageQueueAveragely，默认）

核心逻辑：将所有队列按顺序排序，所有消费者按ClientID排序，然后平均分配队列，余数依次分配给前N个消费者（N=余数）。

示例：Topic有8个队列（q0~q7），消费者组有3个消费者（c0、c1、c2），分配结果：

c0：q0、q1、q2（3个，8÷3=2余2，前2个消费者多1个）；
c1：q3、q4、q5（3个）；
c2：q6、q7（2个）。

适用场景：队列数与消费者数接近，追求分配均匀，适合大多数常规业务（如订单消费、日志消费）。

（2）环形分配策略（AllocateMessageQueueAveragelyByCircle）

核心逻辑：将队列和消费者均按顺序排序，采用“环形轮询”的方式分配队列（消费者依次认领队列，循环往复）。

示例：8个队列（q0~q7），3个消费者（c0、c1、c2），分配结果：

c0：q0、q3、q6；
c1：q1、q4、q7；
c2：q2、q5。

适用场景：队列数远大于消费者数，希望队列分散到不同消费者，避免单个消费者集中处理相邻队列（如分区有序消息场景，减少顺序消费中断）。

（3）一致性Hash分配策略（AllocateMessageQueueConsistentHash）

核心逻辑：基于一致性Hash算法，将消费者哈希到哈希环上，队列也哈希到哈希环上，每个队列分配给顺时针最近的消费者。

优势：消费者扩缩容时，仅需重新分配少量队列（仅影响哈希环上相邻的消费者），减少Rebalance时的队列迁移成本，降低重复消费风险；

劣势：分配均匀性不如平均分配策略；

适用场景：消费者频繁扩缩容的场景（如秒杀活动，需要快速扩容消费者）。

（4）自定义分配策略（AllocateMessageQueueByConfig）

核心逻辑：通过配置文件指定“消费者→队列”的对应关系，不自动分配，完全由开发者控制。

适用场景：特殊业务场景（如队列与消费者绑定，确保特定队列由特定服务器消费，用于数据隔离）。

策略配置方式（代码示例）

// 方式1：配置环形分配策略 DefaultMQPushConsumer consumer = new DefaultMQPushConsumer("order_group"); consumer.setAllocateMessageQueueStrategy(new AllocateMessageQueueAveragelyByCircle()); // 方式2：配置一致性Hash分配策略 consumer.setAllocateMessageQueueStrategy(new AllocateMessageQueueConsistentHash()); // 方式3：自定义分配策略（实现AllocateMessageQueueStrategy接口，后文详细介绍） consumer.setAllocateMessageQueueStrategy(new MyAllocateStrategy());

三、底层源码深挖：从RebalanceService到分配逻辑

理解源码是掌握Rebalance的关键，本节基于RocketMQ 4.9.x版本（主流生产版本），拆解Rebalance的核心源码，重点关注“定时任务触发”“核心方法执行”“分配策略实现”三个部分，跳过无关的工具类和异常处理逻辑。

3.1 核心类与核心接口

Rebalance相关的源码主要集中在client模块，核心类/接口如下（按重要性排序）：

类/接口名称	核心作用
RebalanceService	消费者内部的定时任务，负责定期触发Rebalance，默认每20秒执行一次
AllocateMessageQueueStrategy	分配策略接口，定义了分配队列的核心方法，4种内置策略均实现此接口
DefaultMQPushConsumerImpl	Push消费者的核心实现类，封装了Rebalance的执行逻辑（doRebalance方法）
RebalancePushImpl	Push消费者的Rebalance具体实现类，负责执行队列分配、更新消费关系

3.2 定时触发核心：RebalanceService源码解析

RebalanceService是一个线程类，继承自ServiceThread，在消费者启动时启动，核心逻辑在run方法中，定时调用doRebalance方法触发重平衡（源码位置：org.apache.rocketmq.client.impl.MQClientInstance.RebalanceService）。

// 1. 消费者启动时，会创建MQClientInstance并启动RebalanceService public class MQClientInstance { private final RebalanceService rebalanceService; public void start() throws MQClientException { synchronized (this) { switch (this.serviceState) { case CREATE_JUST: this.serviceState = ServiceState.START_FAILED; // 启动各种服务，包括RebalanceService this.rebalanceService.start(); // 启动RebalanceService线程 break; } } } } // 2. RebalanceService线程运行，定期调用MQClientInstance.doRebalance() class RebalanceService extends ServiceThread { @Override public void run() { while (!this.isStopped()) { this.waitForRunning(waitInterval); mqClientFactory.doRebalance(); // 调用父类的doRebalance方法 } } } // 3. MQClientInstance.doRebalance()遍历所有消费者实例 public void doRebalance() { // 遍历所有已注册的消费者 for (Map.Entry<String, MQConsumerInner> entry : this.consumerTable.entrySet()) { MQConsumerInner consumer = entry.getValue(); if (consumer != null) { try { // 调用每个消费者的doRebalance方法 consumer.doRebalance(); } catch (Throwable e) { log.error("doRebalance exception", e); } } } } // 4. DefaultMQPushConsumerImpl.doRebalance() public void doRebalance() { // 对每个订阅的Topic执行Rebalance for (Map.Entry<String, SubscriptionData> entry : this.subscriptionInner.entrySet()) { this.rebalanceByTopic(entry.getKey(), entry.getValue()); } }

关键细节：

waitForRunning方法：实现线程的定时等待，支持动态调整等待周期（通过consumer.setRebalanceInterval()修改）；
doRebalance方法：Rebalance的核心执行入口，由DefaultMQPushConsumerImpl实现，后续重点解析；
线程启动时机：消费者调用start()方法时，会启动RebalanceService线程。

3.3 Rebalance核心执行：doRebalance方法解析

doRebalance方法是Rebalance的核心，负责串联“获取元数据→筛选资源→执行分配→更新消费关系”的全流程，源码简化如下：

/** * Rebalance核心执行：doRebalance方法解析 * 此方法负责串联"获取元数据→筛选资源→执行分配→更新消费关系"的全流程。 */ // DefaultMQPushConsumerImpl#doRebalance public void doRebalance() { // 遍历所有订阅的Topic for (Map.Entry<String, SubscriptionData> entry : this.subscriptionInner.entrySet()) { String topic = entry.getKey(); try { // 调用RebalanceImpl的rebalanceByTopic方法 this.rebalanceImpl.rebalanceByTopic(topic, entry.getValue()); } catch (Exception e) { log.error("doRebalance exception, topic: {}", topic, e); } } } /** * RebalanceImpl#rebalanceByTopic * 执行单个Topic的队列重新分配，这是RocketMQ实际使用的核心方法。 */ public void rebalanceByTopic(final String topic, final SubscriptionData subscriptionData) { switch (messageModel) { case BROADCASTING: { // 广播模式下，每个消费者消费所有队列 List<MessageQueue> mqAll = this.mQClientFactory.fetchSubscribeMessageQueues(topic); if (mqAll != null) { // 不筛选消费者ID，直接分配所有队列 List<MessageQueue> allocateResult = allocateMessageQueueAveragely(topic, null, mqAll); this.updateProcessQueueTable(topic, allocateResult, subscriptionData); } break; } case CLUSTERING: { // 集群模式下，执行正常的负载均衡分配 // 1. 获取消费者组内所有消费者ID（通过Broker的心跳数据） Set<String> cidAll = this.mQClientFactory.findConsumerIdList(topic, consumerGroup); if (cidAll == null || cidAll.isEmpty()) { log.warn("no consumer in group {}, skip rebalance", consumerGroup); return; } // 2. 获取Topic下所有消息队列 List<MessageQueue> mqAll = this.mQClientFactory.fetchSubscribeMessageQueues(topic); if (mqAll == null || mqAll.isEmpty()) { log.warn("no message queue for topic {}, skip rebalance", topic); return; } // 3. 对队列和消费者ID进行排序，确保所有消费者看到相同的顺序 List<MessageQueue> mqSorted = new ArrayList<>(mqAll); Collections.sort(mqSorted); List<String> cidSorted = new ArrayList<>(cidAll); Collections.sort(cidSorted); // 4. 获取当前消费者的ID String currentCid = this.mQClientFactory.getClientId(); if (currentCid == null) { return; } // 5. 根据分配策略计算当前消费者应分配的队列 AllocateMessageQueueStrategy strategy = this.allocateMessageQueueStrategy; List<MessageQueue> allocateResult = strategy.allocate( this.consumerGroup, currentCid, mqSorted, cidSorted ); // 6. 更新消费关系（核心：对比新旧队列，触发新增/移除） this.updateProcessQueueTable(topic, allocateResult, subscriptionData); break; } default: break; } }

关键步骤拆解：

findConsumerIdsList：从Broker获取当前消费组内的所有在线消费者（通过心跳机制维护）；
findMessageQueues：从NameServer获取订阅Topic的所有队列信息（NameServer维护Topic与队列的映射关系）；
filterAvailableQueues：过滤掉不可用的队列（如Broker宕机、队列状态异常的队列）；
allocateQueue：调用配置的分配策略（AllocateMessageQueueStrategy），计算当前消费者应分配的队列；
updateProcessQueueTable：核心更新逻辑，停止对“移除队列”的消费（提交消费进度、关闭拉取任务），启动对“新增队列”的消费（创建ProcessQueue、提交拉取请求）。

3.4 分配策略源码：以平均分配为例

以默认的平均分配策略（AllocateMessageQueueAveragely）为例，解析分配逻辑的源码实现，核心是allocate方法：

@Override public List<MessageQueue> allocate(String consumerGroup, String currentConsumerId, List<MessageQueue> mqAll, List<String> cidAll) { // 参数校验 if (currentConsumerId == null || currentConsumerId.length() < 1) { throw new IllegalArgumentException("currentConsumerId is empty"); } if (mqAll == null || mqAll.isEmpty()) { throw new IllegalArgumentException("mqAll is empty"); } if (cidAll == null || cidAll.isEmpty()) { throw new IllegalArgumentException("cidAll is empty"); } List<MessageQueue> result = new ArrayList<>(); // 1. 找到当前消费者在消费者列表中的索引 int index = cidAll.indexOf(currentConsumerId); if (index < 0) { // 当前消费者不在列表中，返回空列表 return result; } // 2. 计算基本参数 int mqSize = mqAll.size(); int consumerSize = cidAll.size(); // 3. 计算余数（前rem个消费者多分配1个队列） int mod = mqSize % consumerSize; // 4. 计算当前消费者应该分配多少个队列 int averageSize; if (mqSize <= consumerSize) { // 队列数 <= 消费者数：每个消费者最多分配1个队列 averageSize = 1; } else { // 计算平均值，前mod个消费者多分配1个 averageSize = mqSize / consumerSize; if (mod > 0 && index < mod) { averageSize += 1; // 前mod个消费者多1个队列 } } // 5. 计算起始位置（关键修复点） int startIndex; if (mqSize <= consumerSize) { // 队列数少，每个队列分配给一个消费者 startIndex = index % mqSize; } else { // 正常情况计算起始位置 if (mod > 0 && index < mod) { // 前mod个消费者 startIndex = index * averageSize; } else { // 后面的消费者 startIndex = index * averageSize + mod; } } // 6. 分配队列（关键：连续分配，不是循环分配） int range = Math.min(averageSize, mqSize - startIndex); for (int i = 0; i < range; i++) { result.add(mqAll.get(startIndex + i)); } return result; }

源码逻辑与我们之前讲的平均分配策略完全一致，核心是“计算起始索引、分配数量”，确保队列均匀分配。其他分配策略（环形、一致性Hash）的源码逻辑类似，都是实现allocate方法，差异仅在于分配算法。

四、实战运用指南：生产环境避坑与最佳实践

理解了原理和源码，最终要落地到生产环境。本节结合生产中最常见的Rebalance问题，讲解配置优化、异常处理、最佳实践，帮你避坑。

4.1 核心配置优化（生产必调）

Rebalance相关的配置直接影响消费性能和稳定性，以下是生产环境常用的优化配置，结合代码示例说明：

Rebalance定时周期（rebalanceInterval）

默认值：20000ms（20秒）；
优化建议：非频繁扩缩容场景，改为60000ms（60秒），减少Rebalance触发频率，降低性能损耗；频繁扩缩容场景，保留默认值；
代码配置：consumer.setRebalanceInterval(60000);

2.消费者心跳间隔（heartbeatBrokerInterval）

- 默认值：30000ms（30秒）；
- 优化建议：改为10000ms（10秒），减少Broker对消费者“下线”的误判，避免不必要的Rebalance；
- 代码配置：consumer.setHeartbeatBrokerInterval(10000);

3.消费超时时间（consumeTimeout）

- 默认值：15分钟；
- 优化建议：根据业务处理耗时调整，避免因消费超时导致消费者被误判为宕机（触发Rebalance）；如业务处理耗时最长30秒，设置为60秒；
- 代码配置：consumer.setConsumeTimeout(60);

4.最大重试次数（maxReconsumeTimes）

- 默认值：16次；
- 优化建议：设置为3-5次，避免因消息重试导致消费阻塞，间接引发Rebalance；重试失败后转入死信队列，后续人工处理；
- 代码配置：consumer.setMaxReconsumeTimes(3);

4.2 生产常见问题与解决方案

问题1：分配不均，部分消费者过载、部分空闲

现象：消费者组内，部分消费者消费速度慢、消息积压，部分消费者无队列可消费（空闲）；

原因：队列数与消费者数不匹配（如8个队列，5个消费者），或使用了非平均分配策略；

解决方案：

最优方案：调整队列数为消费者数的整数倍（如8个队列对应4个消费者，12个队列对应3个消费者）；
备选方案：改用平均分配策略（默认），避免使用一致性Hash策略（分配均匀性较差）；
兜底方案：扩容队列数，确保队列数 ≥ 消费者数。

问题2：频繁Rebalance，导致消息积压、重复消费

现象：日志中频繁出现“do rebalance, group=xxx”，消费进度停滞，出现消息积压或重复消费；

常见原因：

消费者心跳超时（网络波动、消费者GC过长）；
手动逐个启动消费者（每启动一个，触发一次Rebalance）；
Rebalance定时周期过短（默认20秒，频繁触发）；

解决方案（以电商大促场景为例）：

优化心跳配置：缩短心跳间隔（如10秒），延长Broker消费者超时时间（brokerConsumerTimeoutMillis=15000）；
批量启动消费者：避免逐个启动，采用脚本批量启动，减少Rebalance触发次数；
提前扩容：大促前30分钟扩容消费者和队列，避免高峰期扩容触发Rebalance；
调整定时周期：将Rebalance间隔改为60秒，减少兜底触发频率。

问题3：Rebalance导致重复消费

现象：Rebalance触发后，部分消息被重复消费；

原因：Rebalance期间，消费者停止消费，但消费进度未及时提交到Broker，新分配队列的消费者从历史进度开始消费；

解决方案：

开启消费进度实时提交：consumer.setConsumeFromWhere(ConsumeFromWhere.CONSUME_FROM_LAST_OFFSET_AND_FROM_MIN_WHEN_BOOT_FIRST_TIME);
缩短消费进度提交间隔：默认5秒，可改为3秒（通过broker配置adjustCommitOffsetPeriod=3000）；
业务层面做幂等：无论是否重复消费，确保业务逻辑正确（如基于消息ID去重）。

问题4：扩容消费者后，消费能力未提升

现象：新增消费者后，消息积压仍未缓解，新增的消费者无队列可消费；

原因：队列数 ≤ 消费者数（如8个队列，10个消费者），新增的2个消费者无队列可分配；

解决方案：

扩容Topic队列数：确保队列数 ≥ 消费者数，新增消费者后，Rebalance会自动将队列分配给新增消费者；
示例：通过mqAdmin扩容队列：sh mqadmin updateTopic -t order_topic -r 10（将队列数扩到10个）。

4.3 生产最佳实践（总结）

队列规划：Topic队列数设置为消费者数的整数倍，建议队列数≥8（便于后续扩容）；
扩容策略：大促等高峰期，提前30分钟扩容消费者和队列，批量启动消费者，避免高峰期Rebalance；
配置优化：根据业务场景调整Rebalance间隔、心跳间隔、消费超时时间，减少不必要的Rebalance；
监控告警：监控Rebalance核心指标（触发次数、耗时、队列分配均匀性），设置告警阈值（如Rebalance次数>10次/分钟、耗时>5秒）；
幂等设计：业务层面必须做消息幂等，避免Rebalance、网络异常导致的重复消费。

五、编程实战：自定义分配策略与Rebalance监听

本节通过两个实战案例，教你如何在代码中使用Rebalance相关的API，包括自定义分配策略、监听Rebalance事件，贴合生产实际开发场景。

案例1：自定义分配策略（实现队列与消费者绑定）

需求：指定消费者c0消费q0、q1队列，消费者c1消费q2、q3队列，实现队列与消费者的固定绑定（数据隔离场景）。

public class FixedAllocateStrategy implements AllocateMessageQueueStrategy { @Override public List<MessageQueue> allocate(String consumerGroup, String currentCID, List<MessageQueue> mqAll, List<String> cidAll) { List<MessageQueue> result = new ArrayList<>(); // 核心：解析当前消费者实例名称。currentCID格式通常为：IP@PID#instanceName String instanceName = extractInstanceName(currentCID); // 根据实例名称分配固定队列 if ("consumer_c0".equals(instanceName)) { for (MessageQueue mq : mqAll) { if (mq.getQueueId() == 0 || mq.getQueueId() == 1) { result.add(mq); } } } else if ("consumer_c1".equals(instanceName)) { for (MessageQueue mq : mqAll) { if (mq.getQueueId() == 2 || mq.getQueueId() == 3) { result.add(mq); } } } // 如果实例名不匹配，返回空列表（该实例将不会消费任何队列） return result; } /** * 从完整的ClientID中提取实例名称 */ private String extractInstanceName(String clientId) { // clientId 格式示例：192.168.1.100@12345#consumer_c0 int index = clientId.lastIndexOf('#'); if (index != -1) { return clientId.substring(index + 1); } return clientId; // 如果没有#，则返回原值（理论上不会发生） } @Override public String getName() { return "FixedAllocateStrategy"; } }

案例2：监听Rebalance事件（监控队列分配变化）

需求：监听Rebalance的执行结果，当队列分配发生变化时（新增/移除队列），打印日志，便于排查问题。

import org.apache.rocketmq.client.consumer.DefaultMQPushConsumer; import org.apache.rocketmq.client.consumer.listener.ConsumeConcurrentlyStatus; import org.apache.rocketmq.client.consumer.listener.MessageListenerConcurrently; import org.apache.rocketmq.client.consumer.rebalance.AllocateMessageQueueAveragely; import org.apache.rocketmq.client.consumer.rebalance.RebalanceListener; import org.apache.rocketmq.client.exception.MQClientException; import org.apache.rocketmq.common.message.MessageExt; import org.apache.rocketmq.common.message.MessageQueue; import java.util.List; import java.util.Set; import java.util.stream.Collectors; public class RebalanceListenerConsumer { // 用于保存上一次分配的队列，以便比较变化 private Set<MessageQueue> lastAssignedQueues = null; public static void main(String[] args) throws MQClientException { RebalanceListenerConsumer app = new RebalanceListenerConsumer(); app.startConsumer(); } public void startConsumer() throws MQClientException { DefaultMQPushConsumer consumer = new DefaultMQPushConsumer("rebalance_listener_group"); consumer.setNamesrvAddr("127.0.0.1:9876"); consumer.subscribe("listener_topic", "*"); // 设置RebalanceListener（正确实现接口） consumer.setRebalanceListener(new RebalanceListener() { @Override public void messageQueueChanged(String topic, Set<MessageQueue> mqAll, Set<MessageQueue> mqDivided) { System.out.println("============== Rebalance触发 =============="); System.out.printf("Topic: %s%n", topic); // 打印所有队列 String allQueues = mqAll.stream() .map(mq -> "q" + mq.getQueueId()) .collect(Collectors.joining(", ", "[", "]")); System.out.printf("Topic所有队列: %s%n", allQueues); // 打印当前消费者分配到的队列 String assignedQueues = mqDivided.stream() .map(mq -> "q" + mq.getQueueId()) .collect(Collectors.joining(", ", "[", "]")); System.out.printf("当前消费者分配到的队列: %s%n", assignedQueues); // 比较队列变化（新增/移除） if (lastAssignedQueues != null) { // 找出新增的队列 Set<MessageQueue> addedQueues = mqDivided.stream() .filter(mq -> !lastAssignedQueues.contains(mq)) .collect(Collectors.toSet()); // 找出移除的队列 Set<MessageQueue> removedQueues = lastAssignedQueues.stream() .filter(mq -> !mqDivided.contains(mq)) .collect(Collectors.toSet()); if (!addedQueues.isEmpty()) { String added = addedQueues.stream() .map(mq -> "q" + mq.getQueueId()) .collect(Collectors.joining(", ")); System.out.printf("✅ 新增队列: %s%n", added); } if (!removedQueues.isEmpty()) { String removed = removedQueues.stream() .map(mq -> "q" + mq.getQueueId()) .collect(Collectors.joining(", ")); System.out.printf("❌ 移除队列: %s%n", removed); } } else { System.out.println("⚠️ 首次分配，无历史队列可比较"); } // 更新历史记录 lastAssignedQueues = mqDivided; System.out.println("========================================\n"); } }); // 消息消费逻辑 consumer.registerMessageListener((MessageListenerConcurrently) (msgs, context) -> { for (MessageExt msg : msgs) { System.out.printf("[消费中] 队列q%d: %s%n", msg.getQueueId(), new String(msg.getBody())); } return ConsumeConcurrentlyStatus.CONSUME_SUCCESS; }); consumer.start(); System.out.println("消费者启动成功，开始监听Rebalance事件..."); // 保持消费者运行 Runtime.getRuntime().addShutdownHook(new Thread(() -> { System.out.println("正在关闭消费者..."); consumer.shutdown(); })); } }

运行效果：当新增/下线消费者、扩容队列时，会打印Rebalance的详细信息，便于监控队列分配变化，快速定位分配异常问题。

六、进阶：Rebalance与其他MQ的差异对比

很多开发者会混淆RocketMQ与Kafka的Rebalance机制，两者虽然都是分布式消费的负载均衡方案，但设计理念和实现逻辑差异较大，以下是核心对比（生产选型必看）：

对比维度	RocketMQ Rebalance	Kafka Rebalance
协调方式	客户端自主计算，无服务端协调（去中心化）	服务端协调（Coordinator集中管理）
全局影响	无全局停顿，仅影响当前消费者的队列分配	全局暂停（Stop-the-World），所有消费者停止消费
重复消费风险	低（消费进度由Broker持久化，分配变化不影响进度）	高（分区重新分配后，Offset可能回退）
扩容速度	快（秒级生效，无需等待集群协调）	慢（依赖重平衡完成，耗时较长）
分配策略灵活性	高（4种内置策略，支持自定义）	较低（仅支持少数内置策略，自定义成本高）
适用场景	高可用、低延迟、频繁扩缩容场景（如电商、支付）	强一致性、复杂分区场景（如日志处理、大数据）