当前位置: 首页 > news >正文

实用指南:Kafka Consumer 消费流程详解

实用指南:Kafka Consumer 消费流程详解

消费模式

pull

  • Consumer主动从Broker中拉取消息
  • 实时性低
  • 拉去时间间隔由用户指定,若设置不当:间隔太短,空请求比例会增加;间隔太长,消息的实时性太差

push

  • Broker收到数据后会主动推送给Consumer
  • 实时性高

Kafka采用Pull模式来消费消息,源于push模式由Broker决定发送速率,很难适应所有消费者的消费速率。

如果Kafka中没有数据,消费者有可能陷入循环,一直返回空材料。

工作流程

拉取消息(Poll)

消费者通过 拉取模式(pull)主动从指定分区拉取消息,拉取时需指定从哪个offset(消息偏移量)开始消费。一条消息只能被一个消费者消费,属于是集群消费。

注意

  • 每个分区的素材只能由一个消费者组里的消费者消费
  • 一个消费者可以消费多个分区
  • 消费者组会统一维护每个分区的消费进度(Offset,即已消费到的消息位置),并将其保存在系统主题(__consumer_offset)里

消费者组

Consumer Group(CG):消费者组,由多个consumer组成。形成一个消费者组的条件,是所有消费者的groupid相同。

作用

  • 避免消息的重复消费,一个分区只会被一个消费者组里的一个消费者消费。如果由多个消费者组,这个消息就会被重复消费
  • 实现负载均衡。消费者组通过分区分配机制,将主题的多个分区分配给组内的不同消费者

注意

  • 消费者组内每个消费者负责消费不同分区的数据,一个分区只能由一个组内消费者消费。
  • 消费者组之间互不影响。所有的消费者都属于某个消费者组,即逻辑上的一个订阅者就是消费者组
  • 如果向消费组中添加更多的消费者,超过主题分区数量,则有一部分消费者就会闲置,不会接收任何消息。

初始化

1. Coordinator 节点选择

消费者组的 Coordinator 节点由 group.id 的哈希值对 __consumer_offsets 主题的分区数(默认 50)取模确定。例如,若 group.id 哈希值为1,1%50=1,则选择 __consumer_offsets 主题 1 号分区所在的 Broker 上的Coordinator作为该组的协调者。

2. 消费者组初始化(JoinGroup 流程)

  1. 发送 JoinGroup 请求:组内每个消费者向 Coordinator 发送 JoinGroup 请求,申请加入消费者组。
  2. 选举 Leader 消费者:Coordinator 从组内消费者中选出一个作为Leader 消费者
  3. 上报消费主题信息:所有消费者将自己要消费的 Topic 信息发送给 Leader 消费者。
  4. 制定消费方案:Leader 消费者根据组内消费者数量和 Topic 分区情况,制定分区分配方案(如 Range、RoundRobin 策略)。
  5. 提交消费方案:Leader 消费者将制定的消费方案发送给 Coordinator。
  6. 下发消费方案:Coordinator 将消费方案下发给组内所有消费者,消费者根据方案确定自己负责的分区。

3. 心跳与重平衡触发

  • 每个消费者会与 Coordinator 保持心跳(默认 3 秒)。若消费者超时(session.timeout.ms 默认为 45 秒)或处理消息时间过长(max.poll.interval.ms 默认为 5 分钟),Coordinator 会将其移除并触发重平衡,重新分配分区。

4. Offset 提交与存储

消费者提交的Offset 会发送到对应 Coordinator 管理的 __consumer_offsets 分区中持久化,确保消费进度的可靠性。

消费流程

1. 发起拉取请求

消费者通过 ConsumerNetworkClient 向 Kafka 集群中对应分区的 Leader Broker(如 TopicA 的 Partition0、1、2 分别对应 broker0、broker1、broker2 的 Leader)发送拉取请求(Fetch Request)

2. 拉取参数控制

拉取过程由多个参数控制:

  • Fetch.min.bytes:每批次最小抓取大小(默认 1 字节),若数据量不足则等待。
  • fetch.max.wait.ms:一批数据未达最小值时的超时时间(默认 500ms),超时后即使数据不足也返回。
  • Fetch.max.bytes:每批次最大抓取大小(默认 50M),防止单次拉取数据量过大。
  • Max.poll.records:一次拉取返回消息的最大条数(默认 500 条)。

3. 接收并缓存拉取结果

Broker 调用回调函数处理拉取请求后,将消息返回给消费者,消费者将结果存入completedFetches 队列(缓存已完成的拉取任务)

4. 消息处理流程

消费者组从队列中获取消息后,依次进行:

  • 反序列化(parseRecord):将字节数据解析为业务可识别的消息格式。
  • 拦截器(Interceptors):可插入自定义逻辑(如日志记录、材料过滤)。
  • 业务处理:执行具体的业务逻辑(如存储、计算、转发等)。

http://www.jsqmd.com/news/55042/

相关文章:

  • 2025年上海继承律师权威推荐榜单:房产律所/婚姻律所/离婚房产律所精选
  • Tokenizer学习心得
  • 2025公寓床源头厂家TOP5权威推荐:口碑好的公寓床定制厂
  • 2025年中国十大公寓床生产厂推荐:公寓床生产厂哪家性价比高
  • 2025年上海离婚房产律所权威推荐榜单:离婚事务所/继承律所/离婚律所精选
  • 应用安全 --- 软件安全 之 选择性加固
  • 2025年工业冷风机十大品牌排行榜揭晓,工厂车间降温通风/锻打车间通风降温/铸造车间通风降温/陶瓷车间降温工业冷风机产品推荐排行榜
  • 详细介绍:2025年(第六届)“大湾区杯”粤港澳金融数学建模竞赛准备!严格遵循要求,拿下大奖!
  • 2025成都抖音短视频运营服务商权威榜单发布
  • 增强AI股票预测分析报告 - 2025年11月29日
  • 2025年南京武汉杭州靠谱的代运营企业推荐:信誉好、比较不错
  • 2025化工玻璃仪器企业TOP5权威推荐:三晶玻璃怎么样
  • 待办事项全栈搭建:Vue3 + Node.js (Koa) + MySQL深度整合,构建生产级任务管理系统的技术实践
  • 2025年上海婚姻律所权威推荐榜单:房产律所/离婚事务所/继承律所律师事务所精选
  • 四、Nodejs基于 Koa 框架的 WebServer 构建与原理解析 - 实践
  • AI股票预测分析报告 - 2025年11月29日
  • 2025年北京公司注册大型机构、资深机构、正规企业TOP5排
  • 2025年11月工业陶瓷厂家最新推荐,聚焦高端定制需求与全案交付能力!
  • 05-OQL查询语言详解
  • 04-实体类与ORM映射
  • AI元人文:论数字猴戏与缺失的“破茧之悟”
  • 02-框架架构与核心组件
  • 03-快速入门与环境配置
  • 01-框架概述与设计理念
  • 小红书代运营公司TOP5权威推荐:资质齐全品牌甄选,助力企业
  • 电力电缆厂家TOP5权威推荐:甄选质量过硬、客户反馈佳的供应
  • CF1666C-Connect the Points
  • 打磨细节质感,成就卓越代码——《代码大全2》第六部分读后感
  • 2025年工业冷风机节能效率排行榜出炉,炼胶车间通风降温/制造业车间通风降温/机械厂车间降温/炼钢车间通风降温工业冷风机厂商选哪家
  • 2025 年 11 月空调机组厂家最新推荐,实力品牌深度解析采购无忧之选!