当前位置：首页 > news >正文

Kafka——Producer/Consumer

news 2026/5/12 4:21:59

Kafka

bootstrap.servers：指定Kafka集群所需的broker地址清单，用于建立初始连接
acks：指定分区中必须有多少个副本收到这条消息，才算消息发送成功。可选值：
- 0（不等待任何相应）
- 1（leader副本确认）
- all/-1（ISR中所有副本确认）
retries：消息发送失败时的重试次数，用于处理临时故障
compression.type：消息压缩算法，用于减少网络传输量。可选值：
- none
- gzip
- snappy
- ls4
- zstd
batch.size：每个批次的内存大小，影响消息的吞吐量和延迟
linger.ms：发送批次前的最大等待时间，用于平衡吞吐量和延迟
buffer.memory：生产者客户端中用于缓存消息的缓冲区大小
key.serializer和value.serializer：消息的键和值的序列化类，用于将消息转换为字节数组
max.request.size:生产者客户端能发送的最大消息大小
request.timeout.ms：生产者等待请求响应的最长时间

定义：发送消息到kafka集群
- 异步发送：直接调用send(record)，不关心发送结果（但可通过回调函数处理结果）。
- 同步发送：调用send(record).get()，等待Kafka响应，获取发送结果（RecordMetadata对象）。
- 带回调的异步发送：调用send(record, new Callback() {...})，在回调函数中处理发送结果。

拉取模式
消费者组：消费组->消费主题->消费分区，从而实现负载均衡。不同消费者组之间互不影响，可以独立地消费同一主题的消息
偏移量管理：消费者可维护偏移量（Offset）来记录自己再分区中消费的位置。偏移量记录方式：重置到较旧的偏移量以重新处理过去的消息；跳到最近的记录从“现在”开始记录

bootstrap.servers：同样用于指定kafka集群的broker地址清单
group.id：消费者所属消费组的唯一标识，用于协调消费者之间的消息分配
auto.offset.reset：当分区没有初始偏移量或偏移量无效时，消费者的行为。可选值：earliest（从最早的消息开始消费）、latest（从最新的消息开始消费）和none（抛出异常）
enable.auto.commit：是否开启自动提交消费位移的功能。
- true（定期自动提交消费位移）
- false（需要手动提交）
anto.commit.interval.ms：自动提交消费位移的时间间隔
fetch.min.bytes：消费者客户端一次请求从kafka拉取消息的最小数据量
fetch.max.bytes：消费者客户端一次请求从kafka拉取消息的最大数据量
max.poll.records：一次拉取请求的最大消息数
max.poll.interval.ms：指定拉取消息线程最长空闲时间
session.timeout.ms：检测消费者是否失效的超时时间
heartbeat.interval.ms：消费者心跳时间，用于维持与消费者协调器的连接
key.deserializer和value.deserializer：消息的键和值的反序列化类，用于将字节数据转换为消息对象