当前位置: 首页 > news >正文

大模型原生支持 MCP——从模型指令到协议直通

一、当前MCP调用的实现方式

在当前的MCP体系中,Agent调用Skill的过程大致如下:用户输入自然语言请求;Agent将请求和Skill列表一起放入Prompt,发送给大模型;大模型理解请求,决定需要调用哪个Skill,并按照约定格式输出JSON调用指令;Agent解析JSON,构造MCP Action,通过MCP客户端发送给网关;网关执行策略、转发到SkillSkill返回结果;Agent将结果再次发送给大模型,让模型生成最终回复。

这个过程可以工作,但存在明显的效率问题。大模型输出JSON调用指令需要额外的token,这些token不产生业务价值。JSON的格式冗余,同样的信息用XML或原生函数调用格式可能更紧凑。Agent需要维护Skill列表和调用历史,上下文可能快速增长。模型输出的JSON可能格式错误或不完整,需要Agent做容错处理。

更根本的问题是,大模型对MCP协议本身没有感知。模型不知道什么是ActionContextPermission。它只是被训练成输出特定格式的文本。这意味着模型无法利用MCP的语义信息来做出更好的决策。

二、原生支持的含义

大模型原生支持MCP意味着模型在训练和推理时,将MCP协议作为一等公民。具体来说,模型应该理解MCP的核心概念:ActionContextPermissionSkillResult。模型能够直接生成结构化的Action,而不是先输出JSON再被解析。模型能够理解Context中的信息,如用户身份、会话状态、记忆。模型能够感知策略约束,知道哪些操作是被允许的,哪些是被禁止的。模型能够处理流式调用,直接消费Skill返回的流式事件。

原生支持可以带来巨大的收益。首先是效率提升,减少token浪费,降低延迟。其次是可靠性提升,模型输出的Action直接是协议兼容的,不需要额外的解析和验证。第三是能力增强,模型可以利用MCP的语义信息做出更智能的决策。第四是简化Agent框架,不需要复杂的Prompt工程来格式化输出。

三、模型层的技术路径

实现大模型原生支持MCP可以有几种技术路径。

路径一:微调

在现有模型的基础上,使用MCP相关的数据进行微调。训练数据包括自然语言请求和对应的MCP Action序列。模型通过微调学会将用户意图映射为MCP Action。这种方法不需要修改模型架构,只需要准备高质量的训练数据。挑战是需要大量的标注数据,且微调后的模型可能在其他任务上性能下降。

路径二:函数调用扩展

OpenAIAnthropicGoogle等模型提供商已经支持函数调用功能。Agent可以声明一组可用的函数,模型决定调用哪个函数以及传入什么参数。MCP Action可以自然地映射为函数调用格式。模型提供商可以将MCP协议作为内置的函数调用模式。这样,Agent不需要在Prompt中描述Skill列表,而是通过API参数传递。模型在响应中直接返回结构化的函数调用,而不是文本。

这种方法实现起来相对简单,不需要修改模型,只需要扩展API。模型提供商可以在服务端将MCPSkill列表转换为函数调用定义。

路径三:协议层内置

在模型的下一个版本中,将MCP协议作为内置能力。模型原生理解ActionContextPermission等概念。模型可以直接输出MCP协议的二进制表示,而不是文本。这需要修改模型架构和训练目标。挑战是成本高、周期长,但收益也最大。

路径四:适配器层

在模型和Agent之间增加一个适配器层。适配器负责将模型的输出转换为MCP Action。适配器可以使用一个小模型或规则系统。这种方法的优点是模型不需要修改,缺点是增加了复杂度和延迟。

Peta正在探索多种路径,并与模型提供商合作推动原生支持。

四、原生支持对Agent框架的影响

当大模型原生支持MCP后,Agent框架的职责将发生变化。

简化Prompt工程

当前Agent框架需要在Prompt中包含大量关于Skill的描述、调用格式、示例。这些内容占用大量token,且需要精心设计。原生支持后,Agent只需要声明可用的Skill标识符,模型内部已经知道这些Skill的语义和调用方式。Prompt大大简化。

减少解析开销

当前Agent需要解析模型输出的JSON,处理各种格式错误。原生支持后,模型直接输出结构化的ActionAgent不需要解析。容错逻辑大幅简化。

更好的流式支持

当前流式调用需要Agent同时处理模型输出的文本流和Skill返回的事件流。原生支持后,模型可以直接消费Skill的事件流,Agent只负责转发。这简化了Agent的实现。

更强的上下文感知

当前Agent需要手动维护Context并传递给模型。原生支持后,模型可以直接从MCP Context中读取信息,Agent不需要在Prompt中重复。

五、对Skill生态的影响

大模型原生支持MCPSkill生态也是重大利好。

模型感知的Skill发现

模型可以根据当前任务动态推荐可用的Skill。用户不需要事先知道Skill的存在,模型会主动提示。例如,用户说帮我分析这份数据,模型可以推荐你可以使用数据分析Skill”

Skill的自描述能力

Skill的规范可以直接作为模型的输入。模型能够理解Skill的输入输出格式、副作用、权限需求。这使得模型可以更智能地决定何时调用哪个Skill

模型辅助的Skill开发

模型可以帮助开发者编写Skill。给定一个API规范,模型可以生成Skill的代码框架和MCP接口定义。这可以显著降低Skill开发的入门门槛。

六、Peta的角色

Peta作为MCP控制平面的实现,在大模型原生支持的演进中扮演着重要角色。

标准化接口

Peta推动MCP协议的标准化,为大模型厂商提供稳定的接口定义。模型厂商可以根据Peta的实现来测试和验证原生支持。

性能基准

Peta提供了MCP调用的性能基准,可以用于评估原生支持的效率提升。模型厂商可以根据这些基准优化实现。

测试工具

Peta提供了MCP协议合规性测试工具,可以验证模型的原生支持是否正确实现了协议。这有助于确保不同厂商的实现之间互操作。

开发者文档

Peta为开发者提供了如何利用原生支持的文档和示例。当模型厂商推出原生支持后,开发者可以快速上手。

七、未来展望

在未来的一到两年内,我们可以期待以下进展。

短期(6-12个月)

模型提供商通过函数调用扩展支持MCP Action输出。Agent框架开始适配,减少Prompt中的Skill描述。开发者可以体验更简洁的Agent开发体验。

中期(12-24个月)

模型开始原生理解Context,能够自动利用用户身份、会话状态等信息。流式调用与模型输出流整合。Skill发现机制开始出现。

长期(24-36个月)

模型原生支持完整的MCP协议,包括ActionContextPermission、流式调用。Agent框架大幅简化,接近于声明式配置。Skill生态爆发式增长,模型成为Skill发现的入口。

八、小结

本章的核心结论可以总结为以下几点。

第一,当前MCP调用通过Prompt工程实现,存在效率低、可靠性差、模型对协议无感知等问题。

第二,大模型原生支持MCP意味着模型理解ActionContextPermission等核心概念,能够直接生成结构化的调用。

第三,技术路径包括微调、函数调用扩展、协议层内置、适配器层。

第四,原生支持将简化Agent框架,减少Prompt工程和解析开销,增强上下文感知和流式处理。

第五,对Skill生态的影响包括模型感知的Skill发现、Skill的自描述能力、模型辅助的Skill开发。

第六,Peta在演进中扮演标准化接口、性能基准、测试工具、开发者文档等角色。

第七,未来一到三年内,我们可以期待从函数调用扩展到完整协议原生支持的逐步演进。

大模型原生支持MCPAgent系统走向成熟的关键一步。它将使Agent开发从繁琐的Prompt工程中解放出来,让开发者专注于业务逻辑。

在下一章,我们将讨论MCP与区块链的集成——不可否认的审计与智能合约Skill

http://www.jsqmd.com/news/1004088/

相关文章:

  • 深度解析百度网盘分享链接:Python工具实现高速下载实战
  • 用Excel实现银行纸币真伪判别:零编程逻辑回归实战
  • 别再手动写接口文档了!Spring Boot 3.x + Knife4j 4.x 保姆级整合教程(含版本选择避坑)
  • 灶福星高速炉选购指南,这些要点需牢记 - 工业品牌热点
  • 不只是跑个仿真:用Cadence 617深入理解共源级放大器的增益、带宽与失真
  • 机器学习生产化落地:从Notebook到稳定服务的系统工程
  • 漫谈人工智能培训创新机构哪家好,新达内给出答案 - myqiye
  • 动态符号加权网络的联合预测框架与技术实现
  • 从示波器波形到代码:手把手调试Vivado LVDS数据环回(附仿真与板级对比)
  • DLSS Swapper完整指南:免费升级游戏性能的智能管理工具
  • 5分钟免费将B站视频转文字:你的终极高效解决方案
  • LED显示技术研发适合项目发展的公司怎么收费?哪家好? - myqiye
  • 呼伦贝尔骑马护具齐全的马场推荐 - 舒雯文化
  • 第三卷:质数王朝志(全卷定稿)
  • 开源 AI 工具链:MCP 协议与工具互操作的标准化设计
  • MCP 与区块链/分布式账本集成——不可否认的审计与智能合约 Skill
  • Token指数下跌引发多空分歧,AI投资逻辑面临考验?
  • Julia Tuple与Dict底层原理:类型系统与哈希引擎深度解析
  • 体验家 XMPlus 企业微信深度集成方案:在企微工作台中构建客户体验管理闭环
  • 【JAVA毕设源码分享】基于springboot闲置书籍共享系统的设计与实现(程序+文档+代码讲解+一条龙定制)
  • Unity游戏语言障碍终极解决方案:XUnity.AutoTranslator完整实战指南
  • 别再只会jstack了!用Arthas的thread命令5分钟定位线上Java线程死锁
  • 告别WiFi和GPS:用UWB给MiniFly无人机做室内‘厘米级’定位的实战笔记
  • Agent 自我治理——基于 MCP 反馈环的持续改进系统
  • 靠谱的专业安保服务品牌有哪些?恒博保安东莞分公司了解一下 - myqiye
  • 别再乱接线了!STM32F103与USB-485模块通信的完整接线与代码避坑指南
  • 告别Office依赖!用LibXL 4.2.0在.NET/C++项目中轻松读写Excel文件
  • 告别大电解电容!用MC14521B芯片DIY一个精准到分钟的数字定时器(附完整电路图)
  • 爱马仕公众号SVG交互设计TOP10:高级动效专业榜单与企业选型报告 - 小小智慧树~
  • 用CD4060和CD4518做个定时插座:从3分钟到1小时,精确控制家电开关