当前位置：首页 > news >正文

2025年AI智能体协议栈：MCP与A2A如何重塑智能体架构与协作

news 2026/5/28 6:41:12

1. 项目概述：为什么2025年的AI智能体必须懂协议？

如果你在2025年还在用传统的方式“硬编码”你的AI智能体，让它孤零零地调用几个API，那你可能已经落后了。今天的AI智能体生态，核心不再是单个模型的强大，而在于它们如何“社交”——如何与其他智能体对话、如何无缝使用成千上万的外部工具、如何组成一个高效协作的“团队”。这个生态的基石，就是协议。过去一年，我深度参与了几个基于新型协议栈的智能体项目，从最初的困惑到后来的豁然开朗，一个清晰的共识正在形成：A2A（Agent-to-Agent）和MCP（Model Context Protocol）这两大协议，已经从一个前沿概念，演变为智能体系统架构的“默认配置”。它们不是二选一，而是构成智能体能力的两个互补维度，就像手机的“蜂窝网络”和“蓝牙/Wi-Fi”一样，一个负责广域连接与协作，一个负责本地外设与工具调用。不理解这套协议栈，你构建的智能体可能永远只是一个功能强大的“孤岛”，无法融入正在爆发的智能体经济。

2. 核心协议深度解析：MCP与A2A的角色与分工

要理解整个生态，我们必须先拆解这两个协议各自解决了什么问题，以及它们为何是互补而非竞争关系。

2.1 MCP：智能体的“万能工具接口”

MCP，由Anthropic发起并迅速获得AWS、IBM、谷歌DeepMind等巨头支持，其核心使命是标准化智能体与外部资源（工具）的交互方式。你可以把它想象成智能体世界的“USB-C”或“蓝牙”协议。

MCP的核心设计原理：它采用经典的客户端-服务器（Client-Server）模型。在这个模型里，你的AI智能体（无论是基于GPT、Claude还是开源模型）扮演“客户端”的角色。而各种各样的能力——比如查询数据库的接口、调用天气API的服务、读写本地文件系统的模块，甚至是一个控制智能家居的指令集——都被封装成独立的“MCP服务器”。这些服务器通过统一的MCP协议，向智能体客户端暴露一组定义清晰的“工具（Tools）”。

一个关键的技术细节是“动态上下文注入”。传统上，我们给大模型提供工具，可能需要手动编写冗长的函数描述，或者依赖特定框架（如LangChain）的封装。MCP服务器在连接时，会主动、结构化地向智能体宣告：“嗨，我这里有这些工具可用，这是它们的名字、描述、参数格式和返回类型。”智能体无需预先知道工具的具体实现，它只需要理解MCP协议，就能在运行时发现并调用这些工具。这彻底改变了工具集成的范式，从“预先绑定”变为“即插即用”。

实操心得：为什么MCP是工具层的必然选择？在我最近的一个数据分析智能体项目中，我们最初为它集成了三个数据源：一个内部MySQL数据库、一个Salesforce API和一个公用的天气API。如果按照老方法，我们需要为每个数据源编写适配器代码，并硬编码到智能体的提示词或函数调用列表中。当我们需要新增一个Google Sheets数据源时，又得修改核心代码并重新部署。

切换到MCP架构后，我们将每个数据源都部署为一个独立的MCP服务器（可以使用官方SDK或开源实现快速搭建）。智能体本身只需要一个通用的MCP客户端库。新增Google Sheets支持时，我们仅仅启动了一个新的MCP服务器进程，并让智能体客户端连接上它。智能体在下一个对话轮次中，就自动“知道”自己多了一个叫query_google_sheet的工具可用。这种解耦带来的运维灵活性和扩展性，是革命性的。

注意：MCP服务器的实现需要考虑身份验证、速率限制和错误处理。一个常见的坑是，MCP服务器暴露的工具描述（Schema）不够精确，导致智能体错误地调用或解析结果失败。务必像设计API一样，严谨地定义每个工具的输入输出。

2.2 A2A：智能体间的“社交网络协议”

如果说MCP解决了智能体“能做什么”的问题，那么A2A（由谷歌主导，现由Linux基金会托管）则解决了智能体“能和谁一起做”的问题。它定义了智能体之间如何发现彼此、沟通意图、委托任务和协同工作。

A2A的核心机制：Agent Card与发现网络A2A引入了一个关键概念：智能体名片（Agent Card）。这是一个标准化的JSON文档，相当于智能体的“数字身份证”和“能力菜单”。它包含了智能体的唯一标识符、所属组织、能力描述（例如：“我可以将自然语言查询转换为SQL”，“我擅长多语言文本摘要”）、支持的任务类型、调用端点（Endpoint）以及必要的元数据（如版本、费用模型等）。

智能体在启动后，可以向一个A2A兼容的注册中心（Registry）发布自己的名片。其他智能体可以通过查询注册中心，动态地发现具备所需能力的合作伙伴。当智能体A遇到一个它无法独立完成的任务（比如，需要将一段中文法律文件翻译并总结）时，它可以通过A2A协议，向它发现的“翻译专家”智能体B发起一个结构化的任务请求。

A2A协议处理的典型交互流程：

能力发现：智能体A查询注册中心：“我需要一个能将中文法律文本翻译成英文并提取关键条款的智能体。”
任务协商与委托：智能体A向智能体B发送一个任务对象，包含输入数据、期望的输出格式、截止时间、奖励机制（如果存在）等。
状态同步与协作：对于长时任务，智能体B可以向智能体A发送进度更新。它们之间还可以进行多轮对话，以澄清需求或协调子任务。
结果交付与确认：智能体B完成任务后，将结果通过A2A协议返回给智能体A，并关闭任务会话。

实操心得：A2A如何改变多智能体系统设计？在没有A2A的时代，构建一个多智能体系统意味着你要预先定义好所有智能体的角色和它们之间的通信通道，这通常是紧耦合的、静态的。我曾参与过一个客户服务自动化项目，其中“理解用户意图”、“查询知识库”、“生成回复”和“检查合规性”由四个不同的智能体模块负责。它们之间的调用关系是硬编码在业务流程引擎里的。

引入A2A后，我们重构了架构。每个模块都成为一个独立的、持有A2A名片的智能体。核心的“流程协调者”智能体不再需要知道具体哪个模块在哪里，它只需要根据用户问题，动态地从注册中心发现并组合最合适的智能体来完成任务。更妙的是，当我们将“合规检查”智能体升级为一个由第三方提供的、更专业的服务时，我们只需要更新注册中心的名录，所有依赖它的智能体都能自动开始使用新版本，无需修改任何代码。这种动态性和可组合性，是构建复杂、可扩展智能体工作流的基础。

3. 双层架构实战：MCP与A2A如何协同工作

理解了各自的分工，我们来看它们如何在实际场景中珠联璧合。一个完整的、面向2025年的智能体系统，通常是下图所示的双层架构：

用户意图（“帮我分析上季度的销售数据并预测下季趋势”） │ ▼ ┌─────────────────────────────────────────────────┐ │ A2A 层（智能体协作网络） │ │ - 智能体A（销售分析专家）发现任务需要预测能力 │ │ - 通过A2A注册中心，发现智能体B（趋势预测专家） │ │ - A向B发起任务委托：“请基于这份销售分析报告进行预测”│ └──────────────────────┬──────────────────────────┘ │ （委托子任务：“进行预测”） ▼ ┌─────────────────────────────────────────────────┐ │ MCP 层（工具调用接口） │ │ - 智能体B（预测专家）需要访问时间序列数据库和Python模型│ │ - 它连接的MCP服务器提供了 `query_sales_db` 和 │ │ `run_prophet_forecast` 两个工具 │ │ - 智能体B通过MCP协议调用这些工具，完成计算 │ └─────────────────────────────────────────────────┘

在这个流程中：

A2A层负责高层次的任务路由与智能体间协调。它解决了“这个任务该由谁（哪个智能体）来处理”以及“多个智能体如何配合”的问题。
MCP层负责底层的资源访问与工具执行。它解决了“这个智能体具体如何操作（使用什么工具）”的问题。

一个具体的开发实例：假设我们要构建一个“智能内容创作工作室”系统。它接收一个视频主题，最终输出一个剪辑好的短视频。

用户提出请求：“做一个关于‘量子计算入门’的科普短视频，风格活泼，时长3分钟。”
主协调智能体（A2A层）接收到请求。它分析任务，发现需要拆解为：脚本撰写、素材搜索、视频生成、配音合成。
A2A协作开始：主协调智能体查询A2A注册中心，发现并委托任务给四个专业智能体：
- 委托给脚本智能体：“撰写一个关于量子计算的3分钟活泼科普脚本。”
- 脚本智能体完成任务后，主协调智能体将脚本分别委托给素材搜索智能体和配音智能体。
- 最后，将脚本、素材和音频委托给视频合成智能体。
MCP工具调用（贯穿始终）：
- 脚本智能体：通过MCP调用search_wikipedia、generate_draft_with_llm等工具。
- 素材搜索智能体：通过MCP调用query_stock_video_library、search_creative_commons_images等工具。
- 配音智能体：通过MCP调用text_to_speech_api工具。
- 视频合成智能体：通过MCP调用video_editing_sdk工具。
最终，主协调智能体通过A2A收集所有子任务结果，组装成最终视频交付给用户。

这个例子清晰地展示了A2A如何像“项目经理”一样在智能体间分配工作，而每个智能体则利用MCP像“工程师”一样使用具体的工具完成任务。

4. 协议生态中的其他重要参与者

虽然MCP和A2A是当前最受瞩目的基础协议，但生态中还有其他重要的协议标准，它们在不同细分领域发挥作用，共同编织起智能体互联网。

ACP（Agent Communication Protocol）由IBM贡献给Linux基金会的ACP，定位更偏向企业级、以任务为中心的通信。它采用RESTful设计，强调标准化、无供应商锁定的任务调用和生命周期管理。如果说A2A像是一个灵活的、去中心化的“社交网络”，那么ACP就更像一个结构化的、有流程管控的“企业工单系统”。它在需要严格审计、合规和与现有企业IT系统（如ERP、CRM）深度集成的场景中可能更具优势。

AG-UI（Agent-User Interaction Protocol）由CopilotKit推动的AG-UI协议，关注的是智能体与最终用户界面（UI）之间的实时、流式交互。它标准化了如何将智能体的思考过程、工具调用进度、部分结果流式地推送到前端界面，以及如何接收用户的实时干预和反馈。这对于构建响应迅速、体验流畅的AI助手类应用至关重要。例如，当智能体在调用一个耗时较长的数据库查询工具时，通过AG-UI，前端可以显示一个“正在查询数据库...”的进度提示，而不是让用户面对一个静止的界面等待。

协议选型策略：对于大多数构建者，我的建议是：

从MCP开始：无论你的智能体是否需要与其他智能体协作，几乎都需要调用外部工具。采用MCP是最大化工具生态兼容性的最佳选择。
在需要复杂协作时引入A2A：当你设计涉及多个专业智能体分工、动态任务分配或希望你的智能体能被外部系统发现的场景时，A2A是必然之选。
将ACP视为企业集成选项：如果你的客户或内部系统环境对RESTful API和严格的任务状态机有强烈偏好，可以评估ACP。
用AG-UI提升前端体验：开发带有Web或移动界面的智能体应用时，集成AG-UI可以极大地提升用户体验。

5. 构建者指南：从协议到可运行系统的实操要点

理解了理论，下一步就是动手。基于MCP和A2A构建系统，需要注意以下几个关键实操环节。

5.1 如何为你的智能体实现MCP客户端

实现MCP客户端，本质上是让智能体学会“说MCP语言”。目前主流的大模型应用框架都已提供或正在集成MCP支持。

主流框架的MCP集成方式：

框架/平台	MCP支持状态	核心实现方式
LangChain	官方支持	使用`langchain-mcp`包。将MCP服务器作为`Tool`或`Runnable`接入Chain。智能体通过LCEL调用。
LlamaIndex	官方支持	通过`MCPToolSpec`将MCP工具封装为Query Engine的工具。智能体在生成响应时自动规划调用。
AutoGen	社区/实验性	可通过自定义`UserProxyAgent`包装MCP客户端，或利用支持MCP的底层LLM（如Claude）实现。
直接使用LLM API	手动实现	需要自行处理与MCP服务器的SSE（Server-Sent Events）连接，解析工具列表，并将工具描述格式化到LLM的系统提示词中，同时处理LLM的函数调用（如OpenAI的`tool_calls`）并转发给MCP服务器。

一个基于LangChain的快速启动示例：

from langchain.agents import AgentExecutor, create_tool_calling_agent from langchain_mcp import MCPServer from langchain_openai import ChatOpenAI # 1. 连接到MCP服务器（假设有一个提供“计算器”和“天气查询”工具的服务器） server = MCPServer.from_tcp_client("localhost", 8000) # 2. 从服务器获取所有可用工具 tools = server.get_tools() # 3. 创建智能体 llm = ChatOpenAI(model="gpt-4o") agent = create_tool_calling_agent(llm, tools, prompt_template) agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True) # 4. 运行智能体 result = agent_executor.invoke({"input": "北京现在的温度是多少？如果是摄氏20度，那么华氏度是多少？"}) print(result["output"])

在这个例子中，智能体会自动使用MCP工具“天气查询”获取北京温度，再用“计算器”工具进行单位换算。

实操心得：调试MCP交互时，一个非常有用的技巧是使用mcp-cli命令行工具。你可以先用它手动连接MCP服务器，列出所有工具并测试调用，确保服务器端工作正常，再将其集成到复杂的智能体逻辑中，这能帮你快速定位问题是出在工具端还是智能体端。

5.2 设计并发布你的A2A智能体名片

智能体名片是你的智能体在A2A网络中的门面，设计好坏直接影响其被发现和调用的效率。

一个结构良好的Agent Card JSON示例：

{ "a2aVersion": "1.0", "id": "urn:uuid:123e4567-e89b-12d3-a456-426614174000", "name": "Financial-Data-Analyzer-Agent", "description": "专精于财务数据分析与可视化，支持利润表、现金流量表等标准报表的生成与趋势解读。", "provider": { "name": "Acme Analytics", "contact": "ai-team@acme.com" }, "capabilities": [ { "type": "TaskExecution", "description": "生成指定时间范围的损益表（P&L）分析报告。", "inputSchema": { "type": "object", "properties": { "companyId": {"type": "string"}, "startDate": {"type": "string", "format": "date"}, "endDate": {"type": "string", "format": "date"}, "reportFormat": {"type": "string", "enum": ["pdf", "markdown"]} }, "required": ["companyId", "startDate", "endDate"] }, "outputSchema": { "type": "object", "properties": { "reportUrl": {"type": "string"}, "summary": {"type": "string"}, "keyMetrics": {"type": "object"} } } } ], "endpoint": "https://agents.acme.com/fin-analyzer/a2a", "authentication": { "required": true, "schemes": ["bearer-token"] }, "pricing": { "model": "per-task", "unitCost": 0.05 } }

设计名片的几个黄金法则：

能力描述要具体、可操作：避免“我能处理数据”这种模糊描述。应像API文档一样，明确说明输入输出。“我能将中文产品描述翻译成英文电商文案”就比“我能翻译”好得多。
输入输出模式（Schema）要严谨：使用JSON Schema清晰地定义参数类型、格式、是否必填、枚举值等。这能极大减少调用时的错误和歧义。
考虑认证与计费：如果服务不是免费的，必须在名片中声明认证方式和计费模型。这是智能体经济能运转起来的前提。
版本控制：当智能体能力升级时，应更新名片版本，并考虑通过不同端点或能力标识来支持多版本共存，避免对调用方造成破坏性变更。

发布名片通常意味着将你的智能体注册到一个A2A目录服务。你可以使用开源的自建注册中心，也可以使用云服务商（如谷歌Cloud）提供的托管服务。

5.3 安全、成本与治理：协议时代的核心挑战

当智能体开始自由地相互调用和使用外部工具时，一系列新的挑战随之而来。

安全挑战与缓解策略：

工具滥用的风险：一个被恶意提示词操控的智能体，可能通过MCP调用删除文件或发送垃圾邮件的工具。
- 缓解：在MCP服务器端实施严格的权限控制（基于Token或角色）。遵循最小权限原则，每个工具只暴露必要的操作。对智能体的输入进行内容安全过滤。
智能体间信任问题：A2A网络中，你的智能体可能将包含敏感数据的子任务委托给一个不受你控制的第三方智能体。
- 缓解：在Agent Card中声明数据处理政策。使用任务级别的加密和隐私计算技术（如联邦学习）。建立智能体声誉系统，优先与高声誉的智能体合作。
供应链攻击：依赖的某个MCP工具服务器或A2A智能体被入侵，可能导致整个工作流被破坏。
- 缓解：对集成的外部服务和智能体进行安全审计。使用代码签名和完整性校验。建立隔离的执行环境（如沙箱）。

成本控制与优化：

工具调用成本：每次MCP工具调用都可能产生费用（如数据库查询、第三方API调用）。
- 优化：在智能体逻辑中加入成本意识。例如，让智能体在调用昂贵的图像生成API前，先通过一个廉价的文本审核工具确认用户指令的合理性。设置每日或每任务的成本预算上限。
智能体间调用成本：A2A任务委托可能涉及计费。
- 优化：设计清晰的服务等级协议（SLA）和定价模型。对于内部智能体，可以建立内部结算机制。使用缓存来避免对相同数据的重复计算。

治理与可观测性：

链路追踪：当一个用户请求经过多个智能体和工具后，如何追溯整个执行路径和排查问题？
- 方案：为每个原始请求分配一个唯一的trace_id，并在所有A2A调用和MCP调用中传递这个ID。使用分布式追踪系统（如OpenTelemetry）来可视化整个工作流。
审计与合规：在金融、医疗等行业，所有自动决策都需要记录。
- 方案：确保所有A2A任务请求/响应和关键的MCP工具调用都被结构化地日志记录，并关联到具体的用户会话和trace_id。

6. 未来展望与行动建议

站在2025年的门槛上，MCP和A2A所定义的互操作性标准，正在将AI智能体从一个个独立的“应用”，转变为互联网上一种新的、可编程的“服务”或“资源”。这带来的不仅是技术架构的变化，更是商业模式和产品思维的变革。

对开发者和创业者的建议：

立即拥抱协议思维：在新项目中，默认采用MCP来集成工具。即使初期只有一个智能体，这也能为未来的扩展打下基础。评估A2A在你产品路线图中的必要性，如果涉及复杂工作流或平台化，尽早规划。
“智能体即产品”：考虑将你的核心能力封装成一个具有清晰A2A名片和MCP工具的智能体。它不仅可以作为你SaaS应用的一部分，更可以作为一个独立的“API智能体”在生态中被调用，创造新的收入流。
深耕垂直领域：通用大模型智能体的竞争会非常激烈。但在法律、医疗、金融、教育等垂直领域，结合了深度领域知识、专用工具链（通过MCP暴露）和协作能力（通过A2A）的专家智能体，将构筑极高的壁垒。

对企业和平台方的建议：

投资协议兼容性：确保你的AI平台、低代码工具或云服务能够无缝接入MCP工具和A2A网络。这将成为吸引开发者和流量的关键基础设施。
构建内部智能体市场：大型企业可以基于A2A协议，构建内部统一的智能体注册与协作平台。让不同部门开发的智能体（如HR招聘助手、IT支持助手、财务分析助手）能够安全、可控地相互调用，形成企业内部的“能力网格”。
关注协议演进：MCP和A2A都处于快速发展期。积极参与相关开源社区，了解协议标准的演进方向，避免技术锁定的风险。

一个值得思考的终极问题：当智能体能够如此方便地发现彼此、组合服务时，我们构建软件的方式是否会从“编写代码调用API”，演变为“编写目标描述，由智能体网络自动组装并执行”？这一天可能比我们想象的更近。而理解并掌握这些协议，正是我们通往那个未来的船票。我个人的体会是，与其观望，不如现在就开始动手，将一个小的、现有的自动化脚本用MCP包装成工具，或者尝试让两个简单的智能体通过A2A的基本格式进行一次对话。从这些微小的实践开始，你就能亲身感受到这场变革的脉搏。

查看全文

http://www.jsqmd.com/news/901546/