当前位置: 首页 > news >正文

A2A 协议落地 —— 从“前瞻设计“到“标准化接入“

讨论 MCP 时,我们用"标准协议替代手写胶水"解决工具暴露问题。但那是"纵向"的——Agent 怎么调用工具。本文讨论"横向"的问题:当有多个 Agent 要相互协作,或者外部系统想把 Shop-Agent 当成一个黑盒能力直接调用时,他们怎么发现 Shop-Agent 能做什么、怎么把任务提交给它、怎么拿到结果?

答案是 A2A(Agent-to-Agent)协议。与 MCP 一样,A2A 本身不是"功能",是"接口标准化"——它不替代业务逻辑,但让业务逻辑能被更多人、更多系统发现和使用。


先看问题:外部系统怎么"用" Shop-Agent?

在没有标准协议之前,外部系统要集成 Shop-Agent 只有两条路:

  1. 直接调 HTTP API:看源码找到对话端点,自己构造请求体、解析响应格式。问题是这套接口是"为人设计的"——同步阻塞、一次一问、没有任务概念。
  2. 用 WebSocket:更低延迟但协议完全自定义。

两个方案的共同问题:没有人能仅凭"标准约定"就知道 Shop-Agent 对外暴露了什么。你永远需要看源码或文档——这就是胶水。A2A 的核心价值不在于"更快"或"更准",在于让机器通过标准协议自动发现和调用 Agent


A2A 协议的四层设计

以 Google A2A 规范为参考,实现了四层:

  • P0 异步任务:提交任务并返回task_id,支持轮询结果和取消——区别于同步 HTTP API 的核心能力。
  • P1 Webhook:任务完成后主动回调订阅方,HMAC 签名防伪造,替代高频轮询。
  • P2 对话共享:外部系统可拉取历史消息,让多个 Agent 读同一段上下文,避免重复提问。
  • P3 健康检查:不只报告进程存活性,对 LLM、向量库、Redis、MCP Server 逐一做依赖探测。

配合Agent CardGET /.well-known/agent-card.json),外部系统在访问任何业务 API 之前就先知道这个 Agent 叫什么、能做什么、能力边界在哪。


核心设计决策

实现中几个关键决策值得展开聊聊——不是"怎么写",而是**“为什么这么选”**。

1. Agent Card 与 MCP 的数据同源

Agent Card 和 MCP 的tools/list都在描述"Shop-Agent 能做什么"——如果两套描述来自不同数据源,早晚会不一致。所以Agent Card 的 skill 列表直接从SkillRegistry生成,与 MCP 共享同一份数据。skills/目录下的 Markdown 文件是唯一的 truth source,加一个 skill 两处自动同步。

Card 里除了 skill 列表,还声明了capabilities.asyncTasks=true——这是 A2A 协议区别于普通 REST API 的关键字段。外部系统看到它就明白:任务异步执行,需要轮询或等 Webhook 回调。

首次构建触发冷启动,之后内存缓存命中——对 discovery 端点来说足够了。

2. 异步任务的"薄壳"模式

A2A 的任务 API 不是另起炉灶重写一套 Agent 调用逻辑。提交任务后立即创建任务记录(状态pending),返回task_id,然后在后台异步调已有的对话服务。

这是刻意为之——只在现有同步调用外面包一层异步外壳。好处很明显:A2A 层薄到不需要维护自己的 Agent 逻辑,所有意图识别、路由、工具调用的改进自动对 A2A 入口生效。

任务状态机只有五个值:pending → running → completed | failed | cancelledcancelled是终态不可恢复。列表接口支持分页,当前使用内存存储。

3. Webhook 与轮询的取舍

轮询方案最简单:每 N 秒查一次任务状态。但高频轮询浪费带宽,低频轮询增加端到端延迟。

Webhook 是 push 模式——任务完成后主动 POST 到订阅方。代价是订阅方需要暴露 HTTP 端点,而且需要防止伪造回调。所以加上了 HMAC-SHA256 签名:注册时提供secret,每次回调在X-A2A-Signature头携带签名。订阅有 TTL 过期机制,内部定时清理。

两个方案不是非此即彼——A2A 协议同时支持轮询和 Webhook,集成方按自己的场景选择。轻量集成(比如脚本)用轮询;生产级集成(n8n、Dify)用 Webhook。

4. 对话共享:A2A 层的公共存储

多 Agent 协作有一个常见痛点:BuyerAgent 问了用户订单号,轮到 MediatorAgent 时又要再问一遍。A2A 层的对话共享就是解这个的——每次对话完成后自动存入公共存储,外部系统通过 API 拉取历史。

公共存储根据数据特点保存到 Redis 或数据库中。

5. 健康检查与服务降级

健康检查对 LLM、向量库、Redis、MCP Server 等依赖做独立探测,返回各自状态。上游编排系统可据此做降级路由——比如 LLM 不可用时暂停任务分发、向量库断连时 RAG 退化为纯 BM25。


A2A + MCP 的职责边界

这两个协议经常被放在一起讨论,但它们的职责完全不重叠:

业务逻辑层

Skill

RAG

DisputeCoordinator

Emotion Detection

MCP 层 — Agent → Tool

工具暴露

资源访问

Schema 自描述

A2A 层 — Agent ↔ Agent

发现

提交任务

轮询

Webhook

A2A 管"谁跟谁说话"——发现 Agent、提交任务、等结果。MCP 管"手里有什么工具"——列出工具、调工具、取资源。两层互不重叠:A2A 不关心 ReActAgent 调了哪个 tool,MCP 不关心任务是谁提交的。


MCP 和 A2A 不能提升意图识别准确率,不能降低 RAG 延迟。它们解决的是另一个层级的问题:当你把系统做完了,谁能"看见"它?如果没有标准协议,答案是"只有你自己"——因为别人要读懂你的源码才知道怎么调用你。有了 MCP 和 A2A,任何遵循相同协议的系统都可以自动发现你、调用你——不需要看源码,不需要写胶水。

配合 MCP 实践,MCP 管纵向(Agent → Tool),A2A 管横向(Agent → Agent),两协议构成了 Shop-Agent 的标准化层。接入成本从"读源码翻文档"降为"读一张 Agent Card + 调一次tools/list"。

实现上有一条核心原则值得单拎出来:A2A 是对外的门,不是对内的水管道。ReActAgent ↔ ToolService 同进程内走直接函数调用就够了——不必把 JSON-RPC 序列化强塞进进程内部。反过来,也没有把DisputeCoordinator内部的 BuyerAgent/SellerAgent/MediatorAgent 拆成独立进程走 A2A 通信——因为它们在同一进程中闭环,拆了只增加网络开销,没有显性收益。知道什么时候不用一个协议,和知道什么时候用它一样重要。

http://www.jsqmd.com/news/1079289/

相关文章:

  • 连续折腾两周 AI 项目后,我发现真正影响开发效率的,从来不只是模型能力 —— 一次使用蓝耘 MaaS 的真实记录
  • 人类全部知识·全域数学统一学习总纲-(Ω-终版·2026.06.28·全覆盖UNESCO 5260门人类学科)
  • HAMAMATSU C8779K-01扫描单元
  • 软件中介者管理化的对象间协调
  • 企业级分布式搜索引擎Transwarp Scope助力企业打造自主可控高性能搜索平台
  • HarmonyOS技术精讲-UI开发调试调优:渲染流水线与硬件加速
  • 终极AI视频插帧指南:用Flowframes轻松提升视频流畅度的完整教程
  • 铰刀异常损耗频发?被忽视的刀柄同轴度问题值得重新审视
  • Go 新手入门:一篇文章讲清楚 go.mod 文件
  • Fable 5有望曲线回归!订阅模式重构,云端接口实锤,6月26日成关键节点
  • STM32-S256-儿童锁+水温度检测+出水量+液位+防干烧+保温沸腾常温+自动+手动+加热+出水+OLED屏+声光提醒+(无线方式选择)-34(设计源文件+万字报告+讲解)(支持资料、图片参考_相
  • crypto-js AES ECB模式跨语言加解密避坑指南
  • DRV8313电机驱动开发实战:从硬件设计到软件调试全解析
  • 2026年数字沙盘行业洞察:从“好看”到“好用”,谁在重新定义空间展示的决策价值?
  • 开源 AI Agent 框架的轻量化设计:从 Ollama 到本地推理的极简之路
  • Rust的匹配中的模式覆盖
  • SQPCC算法:处理互补约束优化问题的序列二次规划方法
  • Spring 异步与事务混用的踩坑与原理分析
  • 告别命令行恐惧:3分钟上手图形化M3U8下载工具
  • 记一次由浮点数精度引发的财务对账“惨案”
  • Koikatsu Sunshine HF Patch:终极游戏增强补丁完整指南
  • Kostka-Foulkes多项式与Chebyshev多项式的表示论桥梁
  • 零基础学习Python建议
  • Bash-it:把 Bash 玩出花的命令行框架
  • Python的类型别名与NewType在领域模型中的类型安全强化
  • Web安全漏洞防范
  • SPC统计过程控制:从入门到实战的完整技术路线
  • Go语言的sync.RWMutex项目分析
  • 深度解析:如何专业控制LG Ultrafine显示器亮度绕过官方限制
  • 用Ansible自动化部署你的个人服务器环境