从单兵作战到团队协作:AgentRun 的多 Agent 生产级协作方案
单个 Agent 再强,也只是一个人在战斗。真正的生产力倍增,来自多个专职 Agent 的协同——而 AgentRun 让这件事变得像调一个 API 一样简单。
多 Agent 并不是新概念,难点也不在于把任务拆给几个 Agent。真正卡住生产落地的,是拆完之后怎么让它们稳定地互相发现、互相调用、互相信任,并且在团队、环境、权限和链路追踪上可管理。
AgentRun 的定位正是把这部分工程复杂度收敛到平台:用 A2A 开放协议打破智能体孤岛,用工作空间提供生产级管理,让开发者把精力放回 Agent 能力本身。
01
从单 Agent 到多 Agent:
为什么协作难落地
Cloud Native
单个 Agent 再强大,面对跨领域的复杂任务,终究会遇到能力边界。一个「点咖啡」的 Agent 不应该知道怎么「安排配送」,一个「写代码」的 Agent 不应该知道怎么「审批流程」。更合理的方式,是让不同 Agent 各司其职,再通过协作机制互相发现、互相调用。
问题在于,自建一套多 Agent 系统并不只是“多写几个 Agent”。你还需要自己解决一整套平台工程问题:
- 注册中心:哪些 Agent 在线?属于哪个环境?当前地址是什么?
- 服务发现:调用方如何找到合适的 Agent?如何读取它的能力描述?
- 跨 Agent 鉴权:谁可以发现谁、调用谁?凭证如何轮转?
- 调度编排:复杂任务如何拆解、分发、重试、聚合结果?
- 环境隔离:开发、测试、生产的 Agent 如何避免互相串用?
- 链路追踪:一次用户请求跨多个 Agent 后,如何定位慢调用和失败点?
每一项单独看都是一个工程项目,加起来可能比写 Agent 本身的代码还多。AgentRun 要解决的不是“发明多 Agent”,而是让多 Agent 从实验室协作变成可上线、可管理、可审计的生产系统。
02
为什么选择 A2A:
用开放协议定义“怎么发现、怎么通信”
Cloud Native
多 Agent 协作最怕被平台私有协议锁死:每接一个 Agent,就要重新适配一套能力描述、鉴权方式和调用协议。Agent 一多,系统很快变成烟囱。
A2A(Agent-to-Agent)是 Google 主导的开放协议,不绑定任何平台。这意味着你自建的 Agent、第三方的 Agent、不同云厂商的 Agent,只要遵循 A2A,就能基于同一套标准互相发现和通信。
它的价值,在于为 Agent 之间的互联提供了一套开放、统一的基础约定:
- 自描述:通过 AgentCard 描述 Agent 是谁、能做什么、怎么访问;
- 可发现:调用方可以基于标准入口获取 AgentCard,而不是依赖人工配置;
- 可互通:不同团队、不同平台、不同运行环境的 Agent,只要遵循协议,就能被统一接入;
- 可演进:协议层定义连接方式,平台层可以继续补齐注册、权限、治理、观测等生产能力。
所以,AgentRun 选择 A2A,不是把 A2A 包装成自己的私有能力,而是基于开放协议承接生态互通,再在协议之上补齐企业落地所需的管理面。
03
A2A 发现机制原理
Cloud Native
▍AgentCard:智能体的自我介绍
A2A 协议通过AgentCard让每个智能体对外自描述能力与接入方式。AgentCard 是一份标准 JSON 文档,描述了:
- 是谁:Agent 的名称、描述、版本、提供方;
- 能做什么:技能列表(Skills),每个技能有 ID、名称、描述和示例问法;
- 怎么访问:服务地址(URL)、支持的传输协议(如 JSON-RPC / gRPC);
- 有什么限制:认证方式、是否支持流式响应等。
按照 A2A 标准,AgentCard 默认托管在 /.well-known/agent-card.json 路径下。客户端只需知道 Agent 的 Base URL,就能拿到这份自描述文档,进而决定如何与它通信。
▍服务发现:谁在这个网络里?
有了 AgentCard,还缺一个关键问题的答案:我怎么知道有哪些 Agent 可以调用?
A2A 协议本身不强制定义中心化注册表,实际项目中通常需要一个「发现层」来管理 Agent 的注册和查询。发现层接受查询请求,返回可用 Agent 的 AgentCard URL,调用方再逐一拉取 AgentCard 完成能力感知。
这也是 AgentRun 发挥价值的地方:协议定义“怎么描述、怎么连接”,平台负责“怎么注册、怎么发现、怎么隔离、怎么治理”。
04
AgentRun 的多 Agent 管理:
注册、发现与隔离
Cloud Native
AgentRun 在 A2A 协议基础上,提供了一套生产级的多 Agent 管理体系,核心围绕三个概念:
▍工作空间(Workspace):逻辑隔离的 Agent 集合
工作空间是 AgentRun 中组织 Agent 的基本单位,类似于一个「项目空间」或「命名空间」。不同业务域、不同团队的 Agent 可以分属不同工作空间,互相隔离,权限独立管理。
一个 Agent Runtime 归属于一个工作空间后,工作空间就成为它对外可被发现的范围边界。
▍发现端点(Discovery Endpoint):按环境隔离的发现入口
一个工作空间内可以配置多个发现端点,典型用法是按部署环境区分:
工作空间: my-ai-platform ├── 发现端点 default → 面向内部调试,包含所有 Agent └── 发现端点 production → 面向生产流量,只含稳定版 Agent每个发现端点维护一张映射表,记录「哪个 Agent」对应「哪个访问地址」。同一个 Agent 在不同端点中可以配置不同地址,例如开发地址和生产自定义域名。
▍平台托管 vs 外部 Agent:统一的发现体验
AgentRun 支持两类 Agent 共存于同一工作空间:
| 类型 | 部署方式 | 注册方式 | 状态流转 |
| 平台托管 Agent | AgentRun 负责部署到 FC | 通过创建注册 | CREATING → READY |
| 外部 Agent | 自行部署在任意位置 | 手动注册到指定空间 | 直接 READY |
两类 Agent 在发现端点中的表现完全一致——调用方拿到的都是标准 a2aAgentCardUrl,无需关心 Agent 实际部署在哪里。
▍凭证安全保护:谁可以发现这些 Agent?
服务发现本身就是敏感信息:暴露工作空间内有哪些 Agent、它们在哪里,可能为攻击者提供侦察入口。AgentRun 在发现端点上内置了凭证验证体系,支持 API Key、HTTP Basic Auth 等方式。
凭证配置与工作空间解耦。更换凭证时,只需在平台重新绑定,无需修改任何 Agent 的代码。
05
实战体验:用“希希咖啡厅”跑通发现链路
Cloud Native
本文以「希希咖啡厅」多 Agent 系统作为演示对象。目标不是展开 SDK 细节,而是让你看到一套多 Agent 如何被纳入 AgentRun 的工作空间,并通过统一发现端点暴露为 A2A 可调用资源。
▍1. 部署模板,准备两个专职 Agent
在 AgentRun 控制台的Agent 模版页面一键部署「希希咖啡厅」,平台会自动创建两个专职 Agent:
- coffee_agent:负责点单、查看菜单、查询订单;
- delivery_agent:负责安排配送和查询配送状态。
▍2. 创建工作空间,确定管理边界
新建一个 Workspace,作为这组 Agent 的组织、隔离和发现边界。后续所有服务发现都以工作空间为范围。
▍3. 注册 Agent,统一托管与外部接入
将平台托管 Agent 或外部 A2A 兼容 Agent 纳入工作空间。注册完成后,调用方看到的都是统一的 a2aAgentCardUrl,不需要关心 Agent 实际部署在 AgentRun、客户自建服务还是第三方平台。
▍4. 配置发现端点,暴露可控的发现入口
在工作空间的「服务发现」中添加端点,配置 Agent 映射和访问凭证。你可以按环境拆分端点,例如 default 用于调试,production 只暴露稳定版 Agent。
▍5. 调用发现端点,拿到 AgentCard 入口
配置完成后,请求工作空间的 discovery API:
curl -s \ -H 'X-API-Key: <your-api-key>' \ 'https://<uid>.agentrun-data.cn-hangzhou.aliyuncs.com/workspaces/<workspace-name>/discovery/agents?discoveryEndpointName=default'响应中的 a2aAgentCardUrl 就是 A2A 客户端连接对应 Agent 的入口。到这里,链路已经跑通:注册 Agent → 配置发现端点 → 获取 AgentCard URL → 发起 A2A 通信。
完整协议字段和 SDK 调用方式可以直接参考官方资料:
- **A2A 官方规范:**https://a2a-protocol.org/latest/specification/
- **a2a-go SDK 示例:**https://github.com/a2aproject/a2a-go
06
从发现到调度:超级 Agent
与生产级多 Agent 方案
Cloud Native
走通 A2A 发现链路后,多 Agent 系统具备了“怎么发现、怎么通信”的基础。但真正进入业务场景,还会继续遇到一个问题:很多用户知道有哪些 Agent,却不知道该怎么搭建协作关系、怎么选择调用顺序、怎么把复杂任务拆给合适的 Agent。
这就是 AgentRun超级 Agent要解决的问题。它不是放在 A2A 之前的孤立功能,而是在 A2A 发现和工作空间管理之上的调度入口:
- A2A 定义 Agent 如何自描述、如何被发现、如何通信;
- 工作空间定义 Agent 如何被组织、隔离、授权、治理;
- 超级 Agent 进一步承担 Orchestrator 角色,把用户意图拆成子任务,并动态调用合适的专职 Agent。
用户:“帮我点一杯拿铁,送到公司” │ ▼ ┌─────────────────────┐ │ 超级 Agent (主) │ ← 理解意图,拆解为子任务 │ Orchestrator │ └──────┬──────┬───────┘ │ │ ▼ ▼ ┌──────────┐ ┌──────────┐ │coffee_ │ │delivery_ │ ← 各自执行专属任务 │agent │ │agent │ └──────────┘ └──────────┘ │ │ ▼ ▼ 创建订单 安排配送相比业界常见的“框架式多 Agent Demo”,AgentRun 更关注生产落地中的管理面:
- 开放互通:基于 A2A 接入平台托管 Agent 和外部 Agent,避免被私有协议锁死;
- 统一治理:通过工作空间、发现端点和凭证体系管理 Agent 的可见范围与访问边界;
- 服务端编排:超级 Agent 在服务端完成调度,调用方只需要面向一个入口发起请求;
- 生产可观测:跨 Agent 调用链路可追踪、可审计,便于定位复杂协作中的失败点;
- 渐进演进:先用 A2A 和工作空间管起来,再用超级 Agent 把协作调度做起来。
换句话说,AgentRun 不是只提供一个多 Agent 编程框架,而是提供一套从开放协议、注册发现、权限隔离到调度编排的生产级方案。后续篇章中,我们会继续展开超级 Agent 如何完成任务拆解、子 Agent 选择和服务端编排。
07
小结
Cloud Native
AgentRun 让多 Agent 协作像调一个 API 一样简单——用 A2A 这个开放标准打破智能体孤岛,用工作空间实现生产级管理,并用超级 Agent 把协作真正组织起来。
如果你已经有自建 Agent、第三方 Agent 或不同云上的 Agent,只要它们遵循 A2A,就可以被纳入同一套发现和通信体系;如果你还没有调度体系,AgentRun 也提供了从注册发现、权限隔离到服务端编排的生产级路径。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
