当前位置: 首页 > news >正文

MCP协议的Token税争议,暴露了更大的问题

最近AI圈有件事值得聊聊。Perplexity公开表示因MCP协议的Token消耗问题弃用了这套方案,引发了不小的讨论。MCP不是被称为"AI世界的USB-C"吗?怎么连头部产品都用不下去?

Token税到底是什么

先把事情说清楚。MCP协议的设计理念没问题——让AI模型通过统一接口连接各种工具和数据源。但实际运行中有个隐性成本:每次AI要调用一个工具,往往需要先经过大模型推理来判断"该不该调、怎么调"。这一轮推理本身就在烧Token。

举个通俗的例子。你让AI助手帮你查日历,理想情况是AI直接读日历接口就行。但MCP的实际流程是:AI先"想一想"要不要查、用什么方式查,这个"想"的过程就消耗了Token。工具调用本身可能只需要几个Token,但前置推理可能花掉几十倍。这就是所谓的Token税。

Perplexity的弃用并非否定MCP的价值,而是算了一笔账:当你的产品核心就是高频调用工具,每一次调用都带着这层推理成本,规模一大就扛不住了。

问题比Token税更深

但如果只盯着Token税看,就错过了更本质的问题。

企业用AI真正缺的不是接口。市面上各种协议、SDK、插件系统已经够多了。真正缺的是一个确定性的执行环境——AI做出决策后,后续的执行路径是可预期的、低损耗的、不需要反复"想"的。

打个比方。你公司请了个非常聪明的项目经理(大模型),他能做出完美的计划。但每执行一步,他都要重新开个会讨论"下一步该干嘛",这个会议本身就在消耗大量时间和资源。效率不是输在计划上,是输在执行链路上。

MCP解决了"连接"的问题,但没有解决"执行"的问题。这才是Perplexity弃用背后的真实逻辑。

确定性执行才是关键

行业里已经有人在往这个方向走了。核心思路是把常见的操作封装成确定性指令,让AI不需要每次都经过完整推理就能直达执行层。

比如AREE的做法:把"读取文件""查询数据库""发送消息"这些高频操作预封装成标准化指令,AI识别意图后直接触发,跳过中间的推理环节。Token消耗因此大幅下降。

JBoltAI最近也在做类似的事情。他们的思路是把MCP的工具调用能力、Function Call机制和指令直达协议结合起来。具体来说:

  • MCP测试工具用来验证工具连通性,确保接口层面没问题
  • Function Call负责AI的决策层,判断该调用什么
  • MCP指令直达则负责执行层,让调用路径尽可能短

三者配合的逻辑是:决策该走推理走推理,执行该走直通道走直通道。不是所有操作都需要大模型"想一遍",很多场景下确定性指令就够了。

对企业意味着什么

如果你是企业AI的负责人,这件事的启示很实际:

选型时别只看协议支持多少工具。要看执行链路的Token效率。同样接入GitHub、Slack、数据库,不同方案的实际消耗可能差一个数量级。

架构上要把"决策"和"执行"分开考虑。决策层用大模型没问题,但执行层应该尽量走确定性路径。这不是某一个产品能解决的,需要在整体架构上做规划。

MCP作为连接标准依然有价值,但它只是拼图的一块。真正让企业AI跑起来的,是从意图识别到最终执行的整条链路都经过了优化。

Token税的争议不会是最后一个。当AI应用从demo走向生产,执行效率的问题只会越来越突出。接口标准化解决了"能不能连"的问题,接下来要解决的是"连了之后怎么跑得起"的问题。

http://www.jsqmd.com/news/798977/

相关文章:

  • 收藏!AI时代工程师的生存指南:小白程序员必备技能升级路线图
  • 3分钟快速解密网易云音乐NCM文件:小白也能轻松掌握的完整教程
  • 暗黑破坏神2存档编辑终极指南:5分钟掌握角色定制与装备管理
  • 使用 SciPy 求解零和博弈纳什均衡的正确建模与实现
  • 3步彻底解决显卡驱动冲突:DDU深度清理完整实践指南
  • SAP PS实战:OPSB参数文件里这两个勾,到底怎么选才能让项目计划成本维护又快又准?
  • 单行文本截断与多行文本截断的区别
  • 从堆叠、分层到双线性:手把手带你复现注意力机制的几次关键进化
  • 抖音无水印下载工具:3分钟学会批量保存高清视频的终极指南
  • React Doctor 深度技术解析:给 AI 写的 React 代码做体检
  • 为什么你的AI微服务越拆越慢?SITS 2026反模式图谱(含12个已验证失效拆分案例+性能衰减基线数据)
  • uni-app iOS后台运行 uni-app App如何实现后台定位或音乐播放
  • 强者心态:重塑人生的九大底层逻辑
  • CST建模避坑指南:布尔操作、掏空与倒角的那些“坑”与最佳实践
  • Autoware实战指南:从零构建与加载高精点云地图
  • 互联网大厂 Java 求职面试:微服务与安全框架的探讨
  • 《动手学大模型》深度技术解析:从微调部署到智能体安全的完整编程实践
  • Windows系统DLL问题完全解决方案:Visual C++运行库智能修复工具实战指南
  • K8s原生ML编排进入“编译期优化”时代(SITS 2026首次披露:eBPF驱动的模型感知调度器Alpha版已交付头部5家云厂商)
  • 别再只调pool_size了!MaxPool2D的strides和padding参数实战避坑指南(附TensorFlow/Keras代码)
  • 2026年浙江复古女鞋产业深度解析:实力供应链如何重塑市场格局 - 2026年企业推荐榜
  • 终极指南:3分钟为Minecraft安装专业级光线追踪效果
  • Thorium浏览器实战:深度解密90号元素如何重塑Chromium体验
  • 从辉煌到衰落:47 年沉浮的 dBase,AI 助力用户逃离困境
  • 2026年第二季度湖南密封胶服务商深度**:长沙楚添科技有限公司为何脱颖而出? - 2026年企业推荐榜
  • BT手游这样玩才不花冤枉钱
  • Python并发模型全景解析
  • Stable Diffusion WebUI 深度技术解析:AI 图像生成的瑞士军刀
  • 用PTA题库学C语言:手把手教你拆解‘选择与循环’的嵌套逻辑
  • 跑刀仔【牛客tracker 每日一题】