当前位置: 首页 > news >正文

Flink Agents 0.3 版本规划曝光,多项关键特性值得期待!

【Flink Agents 引发热议】

相信一直关注 Apache Flink 生态的朋友,最近都注意到了 Flink Agents 引发的热议。这是一个全新的 Apache Flink 子项目,旨在提供一个开源的 Agent 框架,用于构建事件驱动的流式 Agent。

【0.2.1 版本发布与 0.3 版本规划】

最近,Flink Agents 发布了 0.2.1 版本,并展示了一个基于该框架构建的 Flink 作业智能运维 Agent,充分展现了其在事件驱动领域的潜力。另外,社区已经启动了 [0.3 版本的规划讨论](https://github.com/apache/flink - agents/discussions/516),其中涉及的不少功能让开发者倍感期待。为此,深入研究了 github 上的讨论、issues 和 PRs,整理了 0.3 的 Roadmap,以帮助感兴趣的开发者了解发展方向并参与其中。

【0.3 版本 Roadmap】

根据社区讨论,Code Freeze 日期为 2026 年 5 月 31 日,预期发布时间为 6 月 15 日。尽管实际的发布时间可能会有所调整,但目前规划中的关键特性包括:

  • Agent Skills 集成
  • 基于 Mem0 的长期记忆后端
  • 支持事件日志按类型配置日志级别
  • 支持工具调用的参数注入
  • 支持跨语言 Action & Events
  • Quickstart 体验增强
  • 优化事件日志显示
  • 支持跨语言资源的异步执行
  • Durable Excution 增强
  • 支持 Python 3.12

部分功能不只是停留在讨论阶段,已经有社区贡献者提交设计方案或者代码实现:

  • [事件日志分级](https://github.com/apache/flink - agents/discussions/552)和 [Quickstart 体验增强](https://github.com/apache/flink - agents/discussions/555)的设计提案已多轮讨论并达成共识。
  • [Agent Skills 集成](https://github.com/apache/flink - agents/discussions/565)和[Mem0 集成](https://github.com/apache/flink - agents/discussions/613)的设计提案已提交,正在讨论中。
  • 跨语言 Action & Events 中的 Event 部分已通过 [PR](https://github.com/apache/flink - agents/pull/561) 提交。
  • Python 3.12 支持已完成。

【期待的功能】

【Agent Skills 集成】

Agent Skills 作为一种轻量级开放格式,旨在用专业知识和工作流扩展 AI Agent 能力,正被越来越多的产品采纳。以 OpenClaw 为例,其成功的一个重要原因就是对 Agent Skills 的支持。一方面,Skills 让工作流更稳定高效;另一方面,用户可以轻松获取组织内或互联网上提供的 Skills,从而扩展自己的 Agent 的能力。Flink Agents 最近发布的 Flink 作业智能运维 Demo 概念与 Agent Skills 相似,利用 LLM 生成问题描述,从向量库检索 SOP,再按照 SOP 执行操作。相比 RAG,Agent Skills 更轻量。在 Flink 0.3 发布后,感兴趣的开发者可以利用 Agent Skills 重构该 Demo。社区已发布集成提案:。目前看来,其渐进式披露机制的实现与其他框架类似。真正的区别在于 Flink Agents 作为基于 Flink 的分布式框架,如何支持在 yarn 或 k8s 集群中提供和分发 Skills,是一个值得深思的工程挑战。

【Mem0 长期记忆后端】

长期记忆是 Agent 上下文管理的关键,尤其是对于 7 * 24 小时连续运行、不断消费事件的 Agent,而这正是 Flink Agents 的目标场景。在 0.2 版本中,Flink Agents 已原生支持长期记忆及一个粗糙的自动压缩机制。实际上,这个功能正是开发者开发的。在实现过程中意识到,长期记忆管理(尤其是压缩)极其复杂。在 Flink Agents 内从零构建成熟方案挑战巨大。此外,流式 Agent 和对话 Agent 对长期记忆管理的需求差异不大。因此,调研了其他 Agent 框架的实现,以及一些专门的记忆管理框架,最终选择了 Mem0。Mem0 是专为 AI Agent 设计的智能记忆层。通过支持 Mem0 作为后端,可以基于开源生态,提供更成熟易用的记忆管理能力,避免重复造轮子。

【持久执行增强】

基于 Flink 构建,Flink Agents 的天然优势就是容错。Flink 基于 Chandy - Lamport 算法实现了检查点机制,允许从 Checkpoint 恢复而无需从头重新消费数据。但问题在于对 Agent 而言,仅靠 Checkpoint 恢复不够。从 Checkpoint 恢复,会导致该 Checkpoint 后已经处理过的事件被重新消费,由于 Agent 频繁调用外部模型和执行动作,这可能造成重复调用和重复执行动作。LLM 调用成本高,重复执行操作可能有副作用。因此,Flink Agents 一直在容错上进行增强:

  • 0.1 引入了 Action 粒度的一致性,利用 Action Store 避免恢复时重放已执行的 Action。
  • 0.2 提供了 Durable Execution 接口。用户可利用该接口提交代码片段,框架会记录代码片段的返回结果。恢复时若片段已执行完毕则无需重跑,进一步缩小了不一致范围。

但是问题仍然存在,若代码片段在恢复前已开始执行但尚未完成,恢复后仍会被重新执行。由于代码片段可能涉及和外部系统的交互,如调用 LLM 服务、读写向量数据库,仅靠 Flink Agents 无法保证端到端精确一次(Exactly - Once)语义。这与 Flink Sink 是类似的:系统内保证精确一次语义,端到端一致性依赖下游外部系统支持幂等或两阶段提交。Flink Agents 要如何解决这一问题?这仍是开放问题,但一种可能方案是提供 Hook 或回调 API。这将赋予用户根据业务场景自定义逻辑的能力。例如,若外部服务支持幂等,可配置直接重试;或先查询状态再决定。通过这种灵活性,Flink Agents 能更好适应真实世界的可靠性需求。

【事件日志增强】

可观测性对生产级产品至关重要,排查过线上故障的朋友对此应该深有体会。对 Agent 框架而言,由于 LLM 的不确定性,可观测性尤为重要。Flink Agents 基于事件进行 Agent 的编排,并支持生成事件日志和在 Flink Web UI 中展示。通过日志,用户可深入了解 Agent 的执行过程。根据排查 Flink Agents 问题的经验,事件日志确实很有帮助。在最近发布的 Flink 作业智能运维 Demo 中,也可以看到日志如何帮助确认 Agent 行为。但要真正生产就绪,需继续提升事件日志的易用性。0.3 计划了几项关键增强:

  • 日志可读性:当前日志格式对人不够友好,0.3 将支持格式配置。
  • 可配置日志级别:对于复杂 Agent,用户可能只关心部分事件。0.3 将支持按事件类型配置日志级别,灵活满足需求。
  • 结构化查询:随着 Agent 持续运行,日志不断累积。支持结构化查询将帮助用户更高效定位信息。

对 Flink Agents 的 0.3 版本充满期待。因为这不仅仅是功能的新增,更是意味着通过整合这些能力,有机会打造一个真正生产级的事件驱动的流式 Agent 框架。

【附录】

  • 文档网站:
  • Github 仓库:
  • 用户 Slack 频道 [#flink - agents - user](https://apache - flink.slack.com/archives/C09KP5YUWE8) 和开发者 Slack 频道 [#flink - agents - dev](https://apache - flink.slack.com/archives/C097QF5HG8J)
http://www.jsqmd.com/news/675442/

相关文章:

  • 性价比高的品牌全案设计公司汇总,哪家更值得托付 - 工业品牌热点
  • Java八股文实战:从原理到代码,解析Pixel Couplet Gen的Java客户端设计
  • 新建工程2
  • 智慧树刷课插件终极指南:如何3步实现视频自动化学习,效率翻倍![特殊字符]
  • 突破微信单设备限制:WeChatPad技术原理与实现深度解析
  • 2026空气炸锅哪个品牌质量比较好?真实体验与口碑分析 - 品牌排行榜
  • React 请求取消协议:利用 AbortController 在 React 组件卸载时自动中止待处理网络请求
  • 基于 YOLOv11 的无人机航拍小目标检测系统 基于 YOLOv11 的无人机小目标检测系统,基于 VisDrone 2019 数据集,实现从模型训练、验证、推理到 PyQt6 桌面应用的完整流程。
  • Phi-3-mini-4k-instruct-gguf多场景应用:写邮件/解题/写SQL/生成测试用例实战演示
  • 2026年展会展台设计策划公司推荐,靠谱品牌等你选 - mypinpai
  • Bidili Generator效果对比:不同LoRA强度下风格迁移的真实案例展示
  • 通过复制粘贴,就可以写出优秀的提示词
  • 分钟搞懂深度学习AI:实操篇:VGG
  • Golang怎么实现跳表数据结构_Golang如何用Skip List实现有序数据的快速查找【方法】
  • g4f给出JavaScript调用的例子代码,让用户只要能点开网页,就能用ai
  • 分享资质齐全的美术集训画室机构,口碑不错的画室价格多少钱 - 工业推荐榜
  • NaViL-9B企业落地实践:金融文档OCR理解+摘要生成全流程
  • 深聊美术集训实力机构怎么收费,推荐靠谱的画室公司 - myqiye
  • 细聊深圳艾克斯振动盘,维修成本及行业口碑排名究竟怎样 - mypinpai
  • TLPI 第9章 读书笔记:Process Credentials
  • 8.原理图为什么看不到具体的电路(比如STM32的晶振等)
  • 【大模型应用开发】—— Context Engineering:从提示词到上下文工程:LLM应用落地的核心思维跃迁
  • 2026市面上比较实用的互联网行业证书。
  • React 与 GraphQL 碎片(Fragments):利用数据局部性原则优化组件级数据的声明式获取
  • Windows右键菜单终极清理指南:用ContextMenuManager告别菜单臃肿
  • PRD文档中生成符合技术规范和业务逻辑的图表
  • RoadDefectNet 系统采用前后端分离架构,结合了计算机视觉(YOLO)与Web 业务逻辑(Django + Vue3) 智慧交通道-路缺陷检测系统 Django+Vue3 巡检维修管理平台
  • 知识图谱(BILSTM+CRF项目完整实现)【第六章】
  • nli-MiniLM2-L6-H768参数详解:Position Embedding截断长度对长句NLI的影响实测
  • WeChatPad终极指南:3步破解微信平板模式限制,实现安卓多设备登录