当前位置: 首页 > news >正文

MCP 代码执行:构建更高效的 Agent

MCP 代码执行:构建更高效的 Agent

原文:Code execution with MCP | Anthropic Engineering Blog | 2025.11.4

导语

MCP(Model Context Protocol)是连接 Agent 与外部系统的开放标准。社区已构建了数千个 MCP 服务器。但随着连接的工具数量爆炸式增长,传统的"逐个调用工具"方式暴露出严重的效率问题。

Anthropic 提出了一个优雅的解决方案:让 Agent 通过写代码来调用工具


一、传统工具调用的两大瓶颈

工具定义占用过多上下文

当工具数量达到数千个时,模型需要在处理用户请求前处理数十万 token 的工具定义。

中间结果消耗额外 token

直接调用工具时,每次调用的结果都会传回模型。如果在工具之间传递大量数据(如长文档),数据会重复流经上下文窗口。

例如: 从 Google Drive 获取会议记录并更新到 Salesforce,长文本会被加载两次(获取一次,写入一次),可能导致数万个额外 token。


二、代码执行方案

核心思路

不再用函数调用语法,而是将 MCP 服务器呈现为代码 API,Agent 通过编写代码来交互。

文件系统式工具发现

servers
├── google-drive
│   ├── getDocument.ts
│   └── index.ts
├── salesforce
│   ├── updateRecord.ts
│   └── index.ts

Agent 通过探索文件系统按需加载工具定义。

代码编排工具调用

import * as gdrive from './servers/google-drive';
import * as salesforce from './servers/salesforce';const transcript = (await gdrive.getDocument({
  documentId: 'abc123'
})).content;await salesforce.updateRecord({
  objectType: 'SalesMeeting',
  recordId: '00Q5f000001abcXYZ',
  data: { Notes: transcript }
});

效果: Token 使用量从 150,000 降至 2,000,节省约 98.7%


三、五大优势

1. 渐进式披露

Agent 像浏览文件系统一样按需读取工具定义,使用 search_tools 快速定位。

2. 上下文高效的结果处理

数据在执行环境中过滤和转换,只将必要结果返回给模型。

例如: 从 10,000 行电子表格中仅筛选出"待处理"的 5 行数据。

3. 更强大的控制流

使用循环、条件判断和错误处理代码,比链式工具调用更高效。

4. 隐私保护

中间结果保留在执行环境中,可对敏感数据进行令牌化处理(如 PII 替换为占位符),数据不经过模型。

5. 状态持久化与技能

Agent 可将中间结果写入文件,将成功的代码保存为可重用函数(Skills)。


四、注意事项

代码执行引入了额外复杂性:

  • 需要安全的沙箱执行环境
  • 资源限制和监控
  • 基础设施要求比直接工具调用更高
  • 需要在效率提升和实现成本之间权衡

读后感

这篇文章揭示了一个重要趋势:Agent 的工具交互方式正在从"声明式"走向"编程式"

传统的函数调用是"告诉模型调用哪个工具",代码执行是"让模型写代码来编排工具"。后者更灵活、更高效,也更符合软件工程师的思维方式。


本文是 Anthropic AI Agent 系列 第 11 篇,共 15 篇。下一篇:Agent 评测怎么做

关注公众号 coft 获取系列更新。

http://www.jsqmd.com/news/395942/

相关文章:

  • OFA图像语义蕴含模型部署教程:GPU利用率监控与batch size调优指南
  • ERNIE-4.5-0.3B-PT部署避坑:解决‘model not found’、‘out of memory’高频问题
  • 如何设计一个支持地理空间查询(Geo-spatial Query)的数据库索引?
  • 小白必看:Pi0机器人控制中心快速部署指南
  • 阿里开源图片旋转判断:快速解决图片角度问题
  • 2026年知名的柜内香氛五金/家用香氛五金工厂采购指南如何选(实用) - 品牌宣传支持者
  • Python 配置管理的哲学、范式与现代实践:超越 config.ini
  • 深度学习项目训练环境:一键安装与模型训练指南
  • MySQL性能优化:慢查询分析与SQL调优实战
  • 阿里小云KWS模型的多唤醒词识别技术实践
  • 文墨共鸣惊艳效果:朱砂印从‘云泥之别’到‘异曲同工’的渐变视觉动效
  • HY-Motion 1.0动作数据增强算法解析
  • JVM内存模型:深入理解堆内存与元空间
  • 分布式系统CAP理论与BASE理论详解
  • 2026年口碑好的高速贴标机/在线打印贴标机供应商采购指南选哪家 - 品牌宣传支持者
  • 夜红外图像无人机检测数据集VOC+YOLO格式1963张1类别
  • 2026年热门的彩印包装展示箱/彩印包装礼品箱哪家质量好厂家实力参考 - 品牌宣传支持者
  • 2026年质量好的医用护理床/家庭护理床品牌厂家推荐哪家强 - 品牌宣传支持者
  • 快速体验:Qwen3-ASR-0.6B语音识别效果展示
  • Banana Vision Studio快速体验:无需专业技能的设计工具
  • 5分钟搭建LLM API管理平台:支持ChatGLM/文心一言等主流模型
  • 从零开始学GTE模型:文本嵌入技术入门指南
  • 2026年靠谱的入户门智能门锁/源头工厂智能门锁制造厂家实力参考哪家专业 - 品牌宣传支持者
  • 2026年靠谱的快速道闸/停车场道闸源头厂家推荐帮我推荐几家 - 品牌宣传支持者
  • GLM-Image Web界面实战:手把手教你玩转AI绘画
  • 丹青识画多场景落地实践:礼品定制+媒体图库双案例解析
  • 盒马鲜生礼品卡回收指南:快速上手完整流程分享 - 团团收购物卡回收
  • 5分钟上手Swin2SR:AI显微镜无损放大模糊图片实战教程
  • AI绘图不求人:LoRA训练助手帮你自动生成Stable Diffusion标签
  • 基于实时手机检测-通用模型的数据库智能监控系统