当前位置: 首页 > news >正文

学习进度 21

今天主要学了 Direct 模式的 offset 手动管理和窗口函数的小优化,还把之前的 demo 整合了下。之前用 Direct 模式消费 Kafka,offset 是自动管理的,今天试了手动维护,把 offset 存到本地文件里,这样程序重启后能从上次的位置继续消费,不会丢数据也不会重复消费,代码就是在消费后获取每个分区的 offset,再写个方法把它保存下来,启动时再读取加载,步骤不算复杂就是要注意分区和 offset 的对应关系。然后优化了下窗口函数,之前直接用 window 做统计,数据多了有点卡,查了下给 DStream 加了 reduceByKeyAndWindow,比直接 window+reduceByKey 效率高,还试了设置窗口的滑动步长和时长,确认了必须满足时长是步长整数倍的要求,不然会报数据对齐的错,另外还知道了可以用 window 的过滤方法去掉窗口里的冗余数据,让统计更快一点。实操时把手动 offset、reduceByKeyAndWindow 结合起来,做了个从 Kafka 消费、滑动窗口统计、手动存 offset 的完整小 demo,跑起来挺稳定的,过程中踩了个小坑,手动存 offset 时没处理好分区为空的情况,导致程序偶尔报错,加了个非空判断就解决了。
http://www.jsqmd.com/news/350779/

相关文章:

  • 2026年大型集团私有化部署资产管理系统推荐,涵盖房地产、产业园、物业、城投等资产管理系统 - 品牌2026
  • 2026 年大型集团不动产资产管理系统推荐,国有资产管理系统私有化部署公司怎么选 - 品牌2026
  • 主轴刹车器选购指南:从功能定位到关键指标详解 - 品牌推荐大师1
  • 2026年爬坡能力强的电动车排行榜,分析哪家电动车品牌速度快 - 睿易优选
  • 热销榜单:2026年智能马桶品牌排行,帮助你找到舒适性高且售后有保障的最佳选择 - 睿易优选
  • Libero PolarFire SoC ICICLE 开发板 新建一个简单的工程(四) 串口控制和LED控制 C代码 移植 FreeRTOS
  • 防噪音必看!四川三元+4大优质品牌,2025隔音窗厂家TOP5推荐 - 深度智识库
  • 2026国内GEO公司排名前十!权威榜单出炉,企业选型必看 - 品牌测评鉴赏家
  • LangGraph深度解析:打造可控可维护的大模型Agent应用
  • 【长沙学术会议】第二届人工智能与材料国际会议 (IEEE ICAIM 2026)
  • 2026年大型集团不动产资产管理系统选型指南:五大优质服务商深度解析 - 品牌2026
  • 第九天
  • 程序员必藏:大模型检索增强技术深度解析:RAG→Agentic RAG→Graph-R1演进之路
  • 2026年市场有实力的乳胶床垫实力厂家推荐排行榜:专业的乳胶床垫品牌大揭秘 - 睿易优选
  • 2026年减压阀代理商推荐:5 家优质供应商盘点,精准匹配工业流体控制需求 - 博客万
  • 【毕业设计】基于python的媒体资源管理系统设计与实现(源码+文档+远程调试,全bao定制等)
  • 【ai代码审计+黑盒测试】https://bugbunny.ai/ 是漏洞赏金猎人、 安全团队和渗透测试人员加速工作的完美助手
  • 程序员必看!大模型AI学习全攻略+资料包,助你快速入行高薪岗位,收藏不亏!大模型就业行情揭秘:哪些岗位最吃香?
  • 小白必看!2026年OpenClaw入坑指南!OpenClaw部署技术扫盲!
  • 超级浏览器哪个好用?超级浏览器选择建议! - Roxy指纹浏览器
  • 大模型Agent全领域应用:从电影生成到Web导航,附源码,程序员必收藏!
  • 煤炉Mercari被封?2026最全最新封号底层逻辑指南
  • ✅2026年小白必看的OpenClaw(Clawdbot)一键部署教程更新了!
  • 生成式搜索浪潮下,GEO 成品牌增长新引擎 - 品牌测评鉴赏家
  • 一文掌握多模态RAG最优方案:模态特定处理与关系保留架构详解
  • 如何在MD文件中的第多少条前面加符号
  • OpenClaw/Clawdbot是什么?2026年最新搭建教程,简单明了!
  • 31.Android系统源码-ICU实战 - 国际化组件核心技术
  • Python毕设项目推荐-基于python的数字媒体资源管理系统媒体资源管理系统设计与实现【附源码+文档,调试定制服务】
  • 【计算机毕业设计案例】基于python的媒体资源管理系统基于python+Django多媒体资料管理系统(程序+文档+讲解+定制)