当前位置：首页 > news >正文

面向token编程，一夜百万账单，还能抗的住吗？

news 2026/7/23 2:07:31

最近经常听到说现在token的成本已经超过人工了，意味着养一个后端工程师甚至比Vibe Coding更便宜。

Uber就是个典型的例子，5000名工程师人均token账单500-2000美元，四个月用完了全年的AI预算，算一算帐，上千万美金的AI费用，可以养活多少工程师。

还有的企业没有对token限流，导致一夜之间几十、上百万token账单。

花了很多钱后，Agent的产出是什么样呢？现在Github上上星很快的开源项目多是纯Vibe coding，但翻车的不少，用户体验并不好。

比如像前段时间的DeepSeekTUI，这是老美一个音乐专业的学生用AI手搓的Coding Agent（和DeepSeek没什么关系），虽然已经很厉害，但实际用起来bug非常多。

这就引出了Agent的2个瓶颈，上下文碎片化和可验证性缺失。

这是Notion创始人Ivan Zhao在文章中《Steam, Steel, and Infinite Minds》中提出的，几乎是现在各种Agent的通病。

上下文碎片化会导致3个问题。

1、token消耗奇高。因为信息到处分散，数据库、云文档、本地文件等，Agent为了查全信息会塞进超长的上下文，每次请求都会浪费很多token。

如果你用过OpenClaw龙虾，相信会有这样的体会，让它翻译个ppt内容，可能几块钱没了。

2、容易出错，说胡话。上下文不足，或者上下文太长，AI就会胡编乱造，像豆包就会经常出现幻觉。

3、成果很难落地。Agent只会在有限的框框里去完成任务，它不知道一件事的前因后果，背景细节，开发一个货物瑕疵检测小工具容易，但是搭建物流系统就很难，因为涉及很多的流程、规范、变数。

Ivan Zhao的原话是：

聊天、战略文档、仪表盘数据、只存在老员工脑子里的隐性组织经验；现在人类充当 “人肉胶水”，靠复制粘贴、切换浏览器标签拼凑信息。上下文无法统一聚合前，AI Agent 永远被困在碎片化小场景，做不了全链路工作。

举个很简单的例子，你让Agent去修复某张数仓表的bug，告诉它这张表的结构、用途，Agent确实把问题解决了，能run起来，但是另一张下下下游表却出bug，因为某字段字段属性/逻辑被更改，导致无法关联。

结果不可验证同样是致命的问题。

Code 可通过单元测试、运行报错客观验证对错，因此编程 AI 能靠强化学习持续迭代变强；但项目管理、战略方案、业务汇报没有统一客观评判标准，没法量化好坏，AI 缺少闭环反馈，无法自主优化能力，必须人类全程人工校验兜底。

意思是说，Agent执行非代码任务，没有办法自己纠错，因为没有评判标准，遇到问题不会自动停任务，只会反复重试，不断循环，这样会拉爆token。

写代码其实也会出现同样问题，Agent确实会单元测试，但是一个代码项目涉及相当多的业务流程、复杂的判断、循环，Agent虽然能知道哪里有语法bug，但是不知道每个模块之间的业务联系。

所以现在很多AI项目代码出现屎山的情况，需要大量程序员去维护、调试。

我理解针对上下文碎片化和可验证性缺失的瓶颈，解决方案会越来越多，不然也不会出现Claude Code和Codex独树一帜的局面，它们的优化做的确实好。

所以我对Agent的发展是积极乐观的，不光编程，未来大部分工作都可能有Agent参与进来。

查看全文

http://www.jsqmd.com/news/952695/

跟着 MDN 学CSS day_49：定位实例练习从入门到精通

Kafka监控终极指南：5分钟搭建kafka_exporter完整监控体系

ABB变频器备件IGBT模块FS450R12KE3/AGDR-61CS

USB双目摄像头实现实时深度图+彩色点云视频的Python完整工程包

别光看教程了！用Qt6+CMake亲手打造一个跨平台桌面小工具（附完整源码）

新手福音：用快马AI生成你的第一个软件安装包，轻松掌握打包全流程

实测对比：T94-2与T106-2磁环在无线充电LCC电感中的效率差异（附200股利兹线绕制心得）

零基础入门AI智能体：在快马平台动手构建你的第一个日程管理助手

Flutter项目上架AppStore，我踩过的permission_handler权限描述大坑（附完整Podfile配置）

从实习生到独立上手：我是如何用海思PQTool搞定IPC图像调试的

Matlab训练好的U-Net模型别浪费！手把手教你转成ONNX，部署到OpenCV C++和TensorRT上跑起来

智能家居产品经理必看：BLE设备老是掉线？可能是这5种原因（附解决方案与供应商沟通话术）

用MATLAB复现激光TEM模式光斑：从基模到高阶厄米特-高斯光束的完整仿真教程

保姆级教程：用Docker和Nginx-RTMP模块，5分钟搞定个人直播服务器（避坑指南）

AI辅助开发：探索快马平台生成智能高清晰音频管理器的可能性

当markdown遇见快马AI：用自然语言描述生成带智能特性的复杂应用

ANSYS Fluent实现SLM/EBSM熔池仿真：小孔动态与锥形高斯热源参数配置指南

2026年压面机麻辣烫面压面机/免和面压面机定制加工厂家推荐 - 行业平台推荐

2026年知名的食品彩箱/日用品彩箱/彩盒彩箱厂家综合对比分析 - 行业平台推荐

轻量化开放词汇3D场景图动态物体跟踪技术解析

抖音开放平台获取用户手机号，除了解密你还得知道这些安全与合规要点

天赐范式第63天：通过伙伴们对多轮历史推演辩证，范式自省迭代进化——算符-算子正向矩阵 v1.0

Tauri2+Vue3+Ollama 实战｜依托 AI 协同开发全离线隐私记账桌面软件（开源）

613张真实室内盆栽图像数据集，含YOLOv5/v8兼容txt与PASCAL VOC标准xml标注

初学者可用的LBM流动模拟代码包：含Poiseuille、Couette、液膜、圆柱绕流和Shan-Chen多相算例

AI赋能嵌入式开发：通过快马平台智能生成图像边缘检测优化算法

告别‘No FileSystem for scheme hdfs‘：HDP/CDH集群外客户端程序连接HDFS的完整配置流程

效率飙升：用快马AI生成wechatmsg智能监控与定时任务工具

多租户 RAG 权限绕过漏洞：元数据过滤被拼接注入，我们差点赔掉客户

Navicat连接Oracle 11g报错ORA-28547？手把手教你替换OCI文件搞定它

相关文章：