当前位置：首页 > news >正文

MCP 代码执行：构建更高效的 Agent

news 2026/7/8 23:02:20

MCP 代码执行：构建更高效的 Agent

原文：Code execution with MCP | Anthropic Engineering Blog | 2025.11.4

导语

MCP（Model Context Protocol）是连接 Agent 与外部系统的开放标准。社区已构建了数千个 MCP 服务器。但随着连接的工具数量爆炸式增长，传统的"逐个调用工具"方式暴露出严重的效率问题。

Anthropic 提出了一个优雅的解决方案：让 Agent 通过写代码来调用工具。

一、传统工具调用的两大瓶颈

工具定义占用过多上下文

当工具数量达到数千个时，模型需要在处理用户请求前处理数十万 token 的工具定义。

中间结果消耗额外 token

直接调用工具时，每次调用的结果都会传回模型。如果在工具之间传递大量数据（如长文档），数据会重复流经上下文窗口。

例如： 从 Google Drive 获取会议记录并更新到 Salesforce，长文本会被加载两次（获取一次，写入一次），可能导致数万个额外 token。

二、代码执行方案

核心思路

不再用函数调用语法，而是将 MCP 服务器呈现为代码 API，Agent 通过编写代码来交互。

文件系统式工具发现

servers
├── google-drive
│   ├── getDocument.ts
│   └── index.ts
├── salesforce
│   ├── updateRecord.ts
│   └── index.ts

Agent 通过探索文件系统按需加载工具定义。

代码编排工具调用

import * as gdrive from './servers/google-drive';
import * as salesforce from './servers/salesforce';const transcript = (await gdrive.getDocument({
  documentId: 'abc123'
})).content;await salesforce.updateRecord({
  objectType: 'SalesMeeting',
  recordId: '00Q5f000001abcXYZ',
  data: { Notes: transcript }
});

效果： Token 使用量从 150,000 降至 2,000，节省约 98.7%。

三、五大优势

1. 渐进式披露

Agent 像浏览文件系统一样按需读取工具定义，使用 search_tools 快速定位。

2. 上下文高效的结果处理

数据在执行环境中过滤和转换，只将必要结果返回给模型。

例如： 从 10,000 行电子表格中仅筛选出"待处理"的 5 行数据。

3. 更强大的控制流

使用循环、条件判断和错误处理代码，比链式工具调用更高效。

4. 隐私保护

中间结果保留在执行环境中，可对敏感数据进行令牌化处理（如 PII 替换为占位符），数据不经过模型。

5. 状态持久化与技能

Agent 可将中间结果写入文件，将成功的代码保存为可重用函数（Skills）。

四、注意事项

代码执行引入了额外复杂性：

需要安全的沙箱执行环境
资源限制和监控
基础设施要求比直接工具调用更高
需要在效率提升和实现成本之间权衡

读后感

这篇文章揭示了一个重要趋势：Agent 的工具交互方式正在从"声明式"走向"编程式"。

传统的函数调用是"告诉模型调用哪个工具"，代码执行是"让模型写代码来编排工具"。后者更灵活、更高效，也更符合软件工程师的思维方式。

本文是 Anthropic AI Agent 系列 第 11 篇，共 15 篇。下一篇：Agent 评测怎么做

关注公众号 coft 获取系列更新。

http://www.jsqmd.com/news/395942/

相关文章：

OFA图像语义蕴含模型部署教程：GPU利用率监控与batch size调优指南

ERNIE-4.5-0.3B-PT部署避坑：解决‘model not found’、‘out of memory’高频问题

如何设计一个支持地理空间查询（Geo-spatial Query）的数据库索引？

小白必看：Pi0机器人控制中心快速部署指南

阿里开源图片旋转判断：快速解决图片角度问题

2026年知名的柜内香氛五金/家用香氛五金工厂采购指南如何选（实用） - 品牌宣传支持者

Python 配置管理的哲学、范式与现代实践：超越 config.ini

深度学习项目训练环境：一键安装与模型训练指南

MySQL性能优化：慢查询分析与SQL调优实战

阿里小云KWS模型的多唤醒词识别技术实践

文墨共鸣惊艳效果：朱砂印从‘云泥之别’到‘异曲同工’的渐变视觉动效

HY-Motion 1.0动作数据增强算法解析

JVM内存模型：深入理解堆内存与元空间

分布式系统CAP理论与BASE理论详解

2026年口碑好的高速贴标机/在线打印贴标机供应商采购指南选哪家 - 品牌宣传支持者

夜红外图像无人机检测数据集VOC+YOLO格式1963张1类别

2026年热门的彩印包装展示箱/彩印包装礼品箱哪家质量好厂家实力参考 - 品牌宣传支持者

2026年质量好的医用护理床/家庭护理床品牌厂家推荐哪家强 - 品牌宣传支持者

快速体验：Qwen3-ASR-0.6B语音识别效果展示

Banana Vision Studio快速体验：无需专业技能的设计工具

5分钟搭建LLM API管理平台：支持ChatGLM/文心一言等主流模型

从零开始学GTE模型：文本嵌入技术入门指南

2026年靠谱的入户门智能门锁/源头工厂智能门锁制造厂家实力参考哪家专业 - 品牌宣传支持者

2026年靠谱的快速道闸/停车场道闸源头厂家推荐帮我推荐几家 - 品牌宣传支持者

GLM-Image Web界面实战：手把手教你玩转AI绘画

丹青识画多场景落地实践：礼品定制+媒体图库双案例解析

盒马鲜生礼品卡回收指南：快速上手完整流程分享 - 团团收购物卡回收

5分钟上手Swin2SR：AI显微镜无损放大模糊图片实战教程

AI绘图不求人：LoRA训练助手帮你自动生成Stable Diffusion标签

基于实时手机检测-通用模型的数据库智能监控系统