当前位置: 首页 > news >正文

AI 开发经济学改写:从行政驱动到技术质变,Token 消耗策略大转变

【导语:去年 Meta 将员工 Token 消耗量纳入绩效考核,引发无意义消耗现象。如今,Tokenmaxxing 迎来第二阶段,由技术质变驱动,改写了 AI 开发的经济学,同时也带来了安全攻防和权力分配的新变化。】


Tokenmaxxing 第一阶段:行政驱动的无意义消耗

去年 Meta 把员工的 Token 消耗量写进绩效考核,导致员工让两个 Agent 互相对话一整天来刷量,这种现象被称为 tokenmaxxing。这是因为大量资历老的员工抗拒 AI 工具,公司只能用行政手段推动团队使用 AI。

Tokenmaxxing 第二阶段:技术质变带来新逻辑

如今,Tokenmaxxing 的第一阶段已经结束,第二阶段开始,逻辑恰恰相反。这次是技术本身出现了质变,模型质量越过临界点,token 烧得越多,输出质量越好。以前让 Agent 长时间跑会出现 compounding error,现在“loops”模式基本是每多跑一轮就更好一点。

这个变化直接改写了 AI 开发的经济学,成本效率的计算不再是哪个模型单次调用最便宜,而是哪个模型能在等预算下跑更多轮。

不同模型成本效率对比

以 Claude Opus 和 GLM 5.2 为例,Claude Opus 每轮迭代带来 1.1× 的提升,GLM 5.2 带来 1.05×,但 GLM 的价格只有 Claude 的 1/5。多跑几轮之后,便宜模型反而在前头。GLM 5.2 约 $1.40/M 输入、$4/M 输出;Opus 4.X 是 $5/M 输入、$25/M 输出。GLM 5.2 在部分 benchmark 上已经超过 GPT 5.5,Haiku 4.5 更是被碾压。

安全攻防与权力分配新变化

Anthropic 的 Mythos 模型在 AISI 的网络安全测试里,100M token 预算下没有出现任何边际收益递减的迹象,这意味着安全攻防正在变成经济战,谁能比对手多烧 token 谁就赢。

OpenAI 发布了首款自研推理芯片 Jalapeño,和 Broadcom 合作,专门针对自有推理负载优化,模型参与了芯片设计。GPT 5.6 系列通过了美国政府协调的预览,这表明 AI 能力的分配权力正在从行业转移到政府。

编辑观点:Tokenmaxxing 的转变反映了 AI 技术的快速发展,从行政驱动到技术驱动,将对 AI 开发和应用产生深远影响。开发者需重新考虑成本效率,行业竞争也将更加激烈。

http://www.jsqmd.com/news/1098258/

相关文章:

  • Claude Code 安装配置全攻略:解决地区限制与虚拟化平台错误
  • Next.js vs Nuxt3 完整区别对比(2026 最新)
  • Java SpringBoot+Vue3+MyBatis 来访管理系统系统源码|前后端分离+MySQL数据库
  • 3分钟掌握FlicFlac:免费Windows音频格式转换终极指南
  • 从代码到云原生:Dockerfile 编写、Gunicorn/Uvicorn 调优与 WSGI/ASGI 部署架构
  • Selenium自动化测试中Cookie管理实战:免密登录与状态保持
  • 【VMware磁盘映射终极指南】:20年运维专家亲授5种安全映射方案,避免数据丢失与权限越界
  • Vue.Draggable架构演进:从Sortable.js集成到现代Vue组件设计
  • SRWE:让你的Windows窗口随心所欲,游戏截图和工作效率双提升
  • 如何快速提取视频中的PPT内容:extract-video-ppt完整使用指南
  • 办公室小白,如何拿WorkBuddy生成办公会纪要拆分器
  • Vivado里让Aurora、Chip2chip和Ethernet IP共享一对GT时钟的实战踩坑记
  • 如何高效下载番茄小说:打造个人数字图书馆的完整方案
  • PostgreSQL 绿色运行
  • Java Web 高校电动车租赁系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • WVP-GB28181-Pro视频点播超时终极解决方案:从故障定位到系统优化完整指南
  • 数字孪生网络(DTN)技术架构、标准化演进与全场景工业应用研究报告
  • AI时代自动化测试进阶:从脚本执行到智能策略的实战指南
  • Claude Code Agent Teams:构建角色化多智能体开发团队
  • 来访管理系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • 智能模板机 —— 破解枕套生产难题,重塑家纺产业优势
  • Selenium元素操作详解:从定位到稳定交互的实战指南
  • Cursor Free VIP完整指南:三步解锁AI编程助手,永久免费使用Pro功能
  • 如何让你的《环世界》告别卡顿?Performance-Fish性能优化完全指南
  • 企业级来访管理系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • 量子化学计算中的VQE算法:原理、应用与Ansatz设计对比
  • 接口测试用例设计:从核心维度到自动化落地的实战指南
  • 【infra之路】12-投机解码、量化与推理引擎对比
  • Java SpringBoot+Vue3+MyBatis 旅游出行指南_ms ()abo系统源码|前后端分离+MySQL数据库
  • 程序员转型智能体工程师:从零到一实战指南