当前位置：首页 > news >正文

kafka为什么分区不能那么多

news 2026/7/15 10:21:10

1.生产者内存模型被分区数量击穿
生产者调用send方法发送消息时，不会立即发送，而是先进入一个内存缓冲区，其核心结构是一个concurrentmap，以消息的key为key，value是一个deque，也就是说每一个分区都占一个消息队列，消息发送的时机是达到一定时间或者分区满了才会发送，分区越多，数据越难达到满的状态，发送次数越多，网络io越严重，而且分区越多，而且多个分区竞争发送机会是靠reentrantlock+condition来实现的分区越多竞争越激烈，
2.kafka之所以因为顺序读写和pagecache，分区越多导致磁头不断寻址，顺序读写退化成随机写，pagecache需要在多个文件之间切换，命中率降低
3.Linux系统下，kafka的每一个分区在运行时至少需要打开很多文件的句柄，句柄耗尽后会导致系统文件异常
4.分区多了对消费者的影响也很大，消费者在组在消费者加入或离开时会触发重新分配，分区变化时也会触发重新分配，重新分配会根据分区分配算法，遍历所有分区进行分配，阻塞kafka正常活动，造成stw，分区越多意味着单消费者会分到更多的分区，容易超时被踢出消费者组，再次出发重分配，恶性循环，
5.分区计算公式，max（目标吞吐量/单分区生产者吞吐量，目标吞吐量/单分区消费者吞吐量），在高并发场景下6至12个分区即可满足，

http://www.jsqmd.com/news/892052/

相关文章：

利用taotoken为ubuntu上的claude code提供稳定可靠的api后备支持

Linux 上生成 AppStoreInfo.plist，App Store 上架 iOS

从平面Gerber到3D仿真模型：HFSS 3D Layout导入PCB文件的完整避坑与材料分配指南

面试问项目的QPS是多少，该怎么回答

胶囊网络与知识图谱融合：实现精准图像描述生成的工程实践

Laravel 中间件与装饰器模式的关系与区别？

有效提升品牌AI搜索推荐率|2026支持试用的GEO服务商

从摩尔定律到韬定律：华为给半导体产业的一份新答卷

深圳除甲醛服务第三方调研报告：基于行业标准与实测数据的客观分析 - 环保除醛知识库

iPhone17首次降价就杀疯了！销量直逼3000万台

2026年5月北京钻石回收店推荐：正规靠谱商家指南与收的顶实测 - 奢侈品回收测评

t-SNE非线性降维结合深度学习提升高光谱图像分类精度

微AI设备模型压缩与硬件加速实战：从量化剪枝到边缘部署

2026年河源紫金4家正规奢侈品回收机构盘点 - 小仙贝贝

用过才敢说！盘点2026年人气爆表的的AI论文工具

实测才敢推！2026年最值得信赖的专业降AI率网站

Mozilla 解释 Firefox 在英特尔 Raptor Lake 系统上的崩溃问题

H.264压缩域低码率鲁棒水印：原理、实现与工程实践

手把手教你用Docker封装带Nvidia GPU硬解码的OpenCV+FFmpeg开发镜像

险情处置能力对照：无感定位赋能矿山透明化空间管理，UWB 存在监测断层缺陷

如何高效部署系统授权管理工具：企业级批量许可解决方案终极指南

动态优化集成学习：解决中医文本命名实体识别中的类别不平衡与实体稀疏问题

机器学习赋能硬件安全：从漏洞检测到侧信道分析的实践指南

Redis 有序集合（Zset / Sorted Set）

脉冲神经网络在可穿戴心电监测中的应用：FFT+SNN+SVR架构与硬件部署实践

WebGAL视觉小说引擎：从零开始创作互动故事的终极指南

萧山金城路黄金回收探访：这家商业街区门店为何让人安心？ - 百福黄金回收