当前位置: 首页 > news >正文

面向token编程,一夜百万账单,还能抗的住吗?

最近经常听到说现在token的成本已经超过人工了,意味着养一个后端工程师甚至比Vibe Coding更便宜。

Uber就是个典型的例子,5000名工程师人均token账单500-2000美元,四个月用完了全年的AI预算,算一算帐,上千万美金的AI费用,可以养活多少工程师。

还有的企业没有对token限流,导致一夜之间几十、上百万token账单。

花了很多钱后,Agent的产出是什么样呢?现在Github上上星很快的开源项目多是纯Vibe coding,但翻车的不少,用户体验并不好。

比如像前段时间的DeepSeekTUI,这是老美一个音乐专业的学生用AI手搓的Coding Agent(和DeepSeek没什么关系),虽然已经很厉害,但实际用起来bug非常多。

这就引出了Agent的2个瓶颈,上下文碎片化和可验证性缺失。

这是Notion创始人Ivan Zhao在文章中《Steam, Steel, and Infinite Minds》中提出的,几乎是现在各种Agent的通病。

上下文碎片化会导致3个问题。

1、token消耗奇高。因为信息到处分散,数据库、云文档、本地文件等,Agent为了查全信息会塞进超长的上下文,每次请求都会浪费很多token。

如果你用过OpenClaw龙虾,相信会有这样的体会,让它翻译个ppt内容,可能几块钱没了。

2、容易出错,说胡话。上下文不足,或者上下文太长,AI就会胡编乱造,像豆包就会经常出现幻觉。

3、成果很难落地。Agent只会在有限的框框里去完成任务,它不知道一件事的前因后果,背景细节,开发一个货物瑕疵检测小工具容易,但是搭建物流系统就很难,因为涉及很多的流程、规范、变数。

Ivan Zhao的原话是:

聊天、战略文档、仪表盘数据、只存在老员工脑子里的隐性组织经验;现在人类充当 “人肉胶水”,靠复制粘贴、切换浏览器标签拼凑信息。上下文无法统一聚合前,AI Agent 永远被困在碎片化小场景,做不了全链路工作。

举个很简单的例子,你让Agent去修复某张数仓表的bug,告诉它这张表的结构、用途,Agent确实把问题解决了,能run起来,但是另一张下下下游表却出bug,因为某字段字段属性/逻辑被更改,导致无法关联。

结果不可验证同样是致命的问题。

Code 可通过单元测试、运行报错客观验证对错,因此编程 AI 能靠强化学习持续迭代变强;但项目管理、战略方案、业务汇报没有统一客观评判标准,没法量化好坏,AI 缺少闭环反馈,无法自主优化能力,必须人类全程人工校验兜底。

意思是说,Agent执行非代码任务,没有办法自己纠错,因为没有评判标准,遇到问题不会自动停任务,只会反复重试,不断循环,这样会拉爆token。

写代码其实也会出现同样问题,Agent确实会单元测试,但是一个代码项目涉及相当多的业务流程、复杂的判断、循环,Agent虽然能知道哪里有语法bug,但是不知道每个模块之间的业务联系。

所以现在很多AI项目代码出现屎山的情况,需要大量程序员去维护、调试。

我理解针对上下文碎片化和可验证性缺失的瓶颈,解决方案会越来越多,不然也不会出现Claude Code和Codex独树一帜的局面,它们的优化做的确实好。

所以我对Agent的发展是积极乐观的,不光编程,未来大部分工作都可能有Agent参与进来。

http://www.jsqmd.com/news/952695/

相关文章:

  • 跟着 MDN 学CSS day_49:定位实例练习从入门到精通
  • Kafka监控终极指南:5分钟搭建kafka_exporter完整监控体系
  • ABB变频器备件IGBT模块FS450R12KE3/AGDR-61CS
  • USB双目摄像头实现实时深度图+彩色点云视频的Python完整工程包
  • 别光看教程了!用Qt6+CMake亲手打造一个跨平台桌面小工具(附完整源码)
  • 新手福音:用快马AI生成你的第一个软件安装包,轻松掌握打包全流程
  • 实测对比:T94-2与T106-2磁环在无线充电LCC电感中的效率差异(附200股利兹线绕制心得)
  • 零基础入门AI智能体:在快马平台动手构建你的第一个日程管理助手
  • Flutter项目上架AppStore,我踩过的permission_handler权限描述大坑(附完整Podfile配置)
  • 从实习生到独立上手:我是如何用海思PQTool搞定IPC图像调试的
  • Matlab训练好的U-Net模型别浪费!手把手教你转成ONNX,部署到OpenCV C++和TensorRT上跑起来
  • 智能家居产品经理必看:BLE设备老是掉线?可能是这5种原因(附解决方案与供应商沟通话术)
  • 用MATLAB复现激光TEM模式光斑:从基模到高阶厄米特-高斯光束的完整仿真教程
  • 保姆级教程:用Docker和Nginx-RTMP模块,5分钟搞定个人直播服务器(避坑指南)
  • AI辅助开发:探索快马平台生成智能高清晰音频管理器的可能性
  • 当markdown遇见快马AI:用自然语言描述生成带智能特性的复杂应用
  • ANSYS Fluent实现SLM/EBSM熔池仿真:小孔动态与锥形高斯热源参数配置指南
  • 2026年压面机麻辣烫面压面机/免和面压面机定制加工厂家推荐 - 行业平台推荐
  • 2026年知名的食品彩箱/日用品彩箱/彩盒彩箱厂家综合对比分析 - 行业平台推荐
  • 轻量化开放词汇3D场景图动态物体跟踪技术解析
  • 抖音开放平台获取用户手机号,除了解密你还得知道这些安全与合规要点
  • 天赐范式第63天:通过伙伴们对多轮历史推演辩证,范式自省迭代进化——算符-算子正向矩阵 v1.0
  • Tauri2+Vue3+Ollama 实战|依托 AI 协同开发全离线隐私记账桌面软件(开源)
  • 613张真实室内盆栽图像数据集,含YOLOv5/v8兼容txt与PASCAL VOC标准xml标注
  • 初学者可用的LBM流动模拟代码包:含Poiseuille、Couette、液膜、圆柱绕流和Shan-Chen多相算例
  • AI赋能嵌入式开发:通过快马平台智能生成图像边缘检测优化算法
  • 告别‘No FileSystem for scheme hdfs‘:HDP/CDH集群外客户端程序连接HDFS的完整配置流程
  • 效率飙升:用快马AI生成wechatmsg智能监控与定时任务工具
  • 多租户 RAG 权限绕过漏洞:元数据过滤被拼接注入,我们差点赔掉客户
  • Navicat连接Oracle 11g报错ORA-28547?手把手教你替换OCI文件搞定它