当前位置: 首页 > news >正文

kafka学习要点

一、核心基础概念

  1. 核心角色:Producer(生产者,发消息)、Consumer(消费者,读消息)、Broker(集群节点,存消息 / 处理请求)
  2. 消息载体:Topic(消息逻辑分类),下分多个 Partition(物理存储单元,FIFO 有序,是并行性核心)
  3. 高可用保障:Partition 的 Replica(副本),分 Leader(处理读写)和 Follower(同步备份),ISR(同步副本集)内副本可参与 Leader 选举
  4. 消费核心:Consumer Group(消费者组),组内消费者均分 Topic 分区(避免重复消费),不同组可独立消费(实现广播)
  5. 位置标识:Offset(分区内消息唯一偏移量),消费者通过 Offset 标记消费位置,支持断点续传

二、核心设计(高吞吐 / 高可用关键)

  1. 架构:无主从集群,Kafka≥2.8 用 KRaft 管理元数据(替代 ZooKeeper)
  2. 高吞吐:磁盘顺序写 + 零拷贝 + 批量收发 + 分区并行处理
  3. 高可用:副本同步 + ISR 机制 + 故障自动 Leader 选举
  4. 持久化:消息落地磁盘,支持按时间 / 大小配置保留策略,过期自动清理

三、核心流程

1. 生产者发消息

指定 Topic→通过分区器(按 key 哈希 / 无 key 轮询)确定 Partition→发送到该 Partition 的 Leader→Leader 同步至 ISR 所有 Follower→收到 ISR 全部 ACK 后,向生产者返回成功(ACK 级别可配置)

2. 消费者消费消息

消费者组订阅 Topic→完成分区分配→拉取(Pull)对应 Partition 的消息(指定 Offset)→处理消息→提交 Offset(自动 / 手动,标记消费位置)

四、高频核心配置

1. 生产者
  • acks:确认级别(0 = 不等待确认 / 1=Leader 确认 /-1=ISR 全确认,生产推荐 - 1)
  • batch.size/linger.ms:批量发送阈值 / 等待时间,平衡吞吐与延迟
  • retries:重试次数(生产推荐 3-5,解决网络抖动)
2. 消费者
  • group.id:消费者组标识(必配,同组均分分区)
  • auto.offset.reset:Offset 无效时策略(earliest = 从开头消费 /latest = 从最新消费)
  • enable.auto.commit:是否自动提交 Offset(生产推荐 false,手动提交避免消息丢失)
3. Topic
  • partitions:分区数(可增不可减,决定并行度,建议≥消费者组最大消费者数)
  • replication.factor:副本数(生产≥2,推荐 3,保证高可用)

五、生产核心问题 & 避坑

  1. 消息丢失:生产者设 acks=-1 + 开启重试,消费者用手动提交 Offset
  2. 重复消费:因 Offset 提交失败 / 重平衡导致,消费逻辑需实现幂等性
  3. 分区重平衡(Rebalance):消费者上下线触发,会短暂停消费,尽量保持消费者数量稳定
  4. 幂等 / 事务:生产者开启幂等性避免重复发,跨 Topic / 分区需用 Kafka 事务
http://www.jsqmd.com/news/327983/

相关文章:

  • 2026全年 AI Agent 每周细化学习计划表
  • SpringBoot+Vue +乡政府管理系统平台完整项目源码+SQL脚本+接口文档【Java Web毕设】
  • 设计模式——适配器模式
  • 设计模式——迭代器模式
  • shiro学习要点
  • SpringBoot+Vue 青年公寓服务平台平台完整项目源码+SQL脚本+接口文档【Java Web毕设】
  • OpenClaw:你的个人AI助手,多平台统一控制的革命性方案
  • SpringBoot+Vue 高校教师电子名片系统管理平台源码【适合毕设/课设/学习】Java+MySQL
  • 前后端分离大学生就业需求分析系统系统|SpringBoot+Vue+MyBatis+MySQL完整源码+部署教程
  • MedGemma X-Ray医疗AI落地:符合DICOM基础规范的轻量级方案
  • 经方药食两用服务平台信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • GTE+SeqGPT企业应用案例:某IT公司内部技术知识库智能问答系统落地纪实
  • 企业级Spring Boot疗养院管理系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • 5分钟部署Z-Image-ComfyUI,文生图一键生成超清美图
  • ccmusic-database数字音乐发行:独立音乐人上传作品自动获取流派标签
  • 手把手教你用SiameseUIE搭建智能客服信息抽取系统
  • ChatTTS-究极拟真语音合成实战案例:直播带货话术AI语音实时生成
  • Windows热键冲突终极解决方案:3步定位与企业级优化指南
  • [特殊字符] Nano-Banana效果展示:汽车ECU模块爆炸图生成——高密度部件精准分离
  • DeepSeek-R1-Distill-Qwen-1.5B工具集测评:vLLM/Ollama/Jan效率对比
  • MusePublic艺术创作引擎:5分钟快速生成时尚人像的保姆级教程
  • 人脸识别OOD模型实际作品:质量分分层抽样生成的特征空间分布热力图
  • OpenClaw-AI自动化神器本地部署Clawdbot-macos - fx
  • 医疗风险预测系统:Baichuan-M2-32B与XGBoost的集成建模
  • SeqGPT-560M多场景落地:医疗问诊记录分类、法律合同关键条款抽取
  • StructBERT中文语义系统稳定性测试:7×24小时高并发服务压测报告
  • AI智能文档扫描仪快速上手:无需模型权重的轻量部署教程
  • BGE-M3效果对比:BGE-M3与bge-large-zh-v1.5在专业领域表现
  • GTE-Chinese-Large快速部署:CSDN平台GPU Pod镜像启动时间优化至90秒内
  • Swin2SR交互指南:左侧面板上传与右侧结果查看