当前位置: 首页 > news >正文

额度对半砍?腾讯、字节员工发现,大模型Token额度正在“降本增效”

🔥个人主页:代码不加冰(欢迎来访)
🎬作者简介:java后端学习者
❄️个人专栏:LeetCode刷题日记 , 苍穹外卖日记,SSM框架深入,JavaWeb,
命运的结局尽可永在,不屈的挑战却不可须臾或缺!

大家好,我是代码不加冰,这里给大家分享一个最近比较热点的内容。

从“随便用”到“省着用”,只隔了一次预算复盘会

如果你在腾讯或者字节工作,最近可能已经注意到了:

上个月还能随意调用的混元、豆包大模型API,这个月突然开始“限额”了。原本每月几十万甚至上百万Token的免费额度,被悄悄下调到了几万。有的部门甚至直接取消了员工个人调用权限,统一收归到“按项目申请”。

不是传言。这是正在发生的事情。

以前随便跑,现在跑之前要想想

一位腾讯某事业群的员工向笔者吐槽:

“去年我们做一个需求,随手写个脚本调混元API跑几百条数据做测试,很常见的事。那时候觉得大模型就是工具箱里的一把扳手,想用就用。但这两个月不行了。部门的Token额度被砍了大约70%,现在跑一次批量测试之前,要先想清楚:真的需要跑全量吗?能不能抽样?能不能用规则代替?”

字节跳动的情况类似。一位来自抖音业务线的产品经理说:“豆包的额度以前基本是放开的,我们做A/B测试、做内容评估,大量依赖大模型辅助。上个月底收到通知,个人账号的每日调用上限从10万Token降到了2万。说实话,2万Token听着不少,但你要是跑几十条视频摘要,很快就没了。”

这不是个例,是“降本增效”进入深水区

2023年到2024年,国内大厂在大模型上是不计成本投入的。内部员工用自家模型——那叫“肥水不流外人田”,鼓励用、放开用。一方面是为了测试模型能力,另一方面也是一种员工福利。

但到了2026年,风向变了。

“降本增效”这个词,从2023年喊到现在,前面砍的是差旅、福利、外包预算。现在,轮到大模型了。

原因很直接:

第一,大模型调用不是免费的。即使是对内调用,也要消耗计算资源。GPU服务器、电费、运维成本,这些都是真金白银。过去两年,很多公司的内部API成本翻了几倍甚至十几倍——因为用的人越来越多、用的场景越来越杂。

第二,很多内部调用其实是不必要的。产品经理拿大模型写周报、工程师让大模型写不重要的测试用例、运营让大模型批量生成标题……这些需求在“放开用”的时候看起来很合理,但一算账,加起来是个惊人的数字。

第三,预算收缩了。2026年,大多数互联网公司的增长预期都调低了,预算自然跟着收紧。大模型作为一个相对新兴的成本项,又不像服务器、带宽那样是“刚需”,自然成了被优化的对象。

大厂的逻辑变了:从“放开用”到“用在刀刃上”

腾讯和字节内部传递的信号是类似的:不是不用,是要聪明地用。

具体怎么操作?我了解到几种做法:

1. 分层配额制

不同岗位、不同职级的员工,获得不同的Token额度。核心研发团队额度高,边缘支持岗位额度低。需要更多?走审批流程,说明业务价值和预期收益。

2. 场景分级

一些明显的“低价值”场景被直接限制或禁止。比如用大模型写内部周报、生成演讲稿、润色无关紧要的内部沟通消息——这些被视为“滥用”。而真正产生业务价值的场景(如代码辅助、数据分析、用户洞察)保留优先使用权。

3. 内部成本可视化

以前员工调用API,看不到成本,感觉像免费的。现在很多公司开始做“成本看板”——你调一次大模型,花了公司多少钱,清清楚楚写在监控页面上。

一位腾讯员工展示了他收到的内部邮件截图:“尊敬的同事,您上个月API调用量超过部门平均值的300%,产生成本约XX元。建议您在调用前确认是否必要。”

别小看这个数字。当你亲眼看到自己“随手一跑”花了公司几十块钱的时候,行为会自然收敛。

4. 强制使用更便宜的模型

很多公司内部同时部署了多个版本的大模型:顶配版(千亿参数)、标准版(百亿参数)、轻量版(几十亿参数)。

新规之下,默认调用的是轻量版。只有明确需要复杂推理的任务,才可以申请使用顶配版。大多数日常任务,轻量版完全够用——但员工以前不管,哪个顺手用哪个。

员工怎么看:从“不适应”到“理解,但有点不爽”

对于这个变化,员工的态度分化明显。

一部分人觉得合理:

“说实话,以前确实有点浪费。我自己就经常让大模型帮我写一些其实不需要那么高智能的东西,比如给同事发消息润个色什么的。现在想想确实没必要。”——字节某工程师

“公司不是慈善机构。大模型服务器多贵啊,如果每个人都不节制,最后成本还不是摊到业务头上?业务不赚钱,年终奖从哪来?”——腾讯某产品运营

另一部分人则不太满意:

“我觉得这是‘既要马儿跑,又要马儿不吃草’。公司天天喊着要用AI提效,我们真的去用了,又开始限制额度。到底要不要我们用?”——某大厂匿名员工在内部论坛发帖

“额度降了之后,我现在做数据分析会犹豫。以前可以放心大胆地让模型跑各种角度,现在得先自己想一遍,只把最拿不准的地方交给模型。效率至少掉了30%。”——字节某数据分析师

还有一层隐忧:额度限制会不会影响创新?

“很多好的创意就是试出来的。你让我先审批再测试,那试错成本就高了。不敢试,就出不了新东西。”——腾讯某创新项目组成员

这其实是一个必然的阶段

冷静下来看,这件事并不意外。

任何一项新技术在企业内部的普及,都会经历三个阶段:

第一阶段:尝鲜期。技术新、成本高、使用者少。公司鼓励用,不计成本。

第二阶段:滥用期。人人都想试试,各种场景一拥而上。成本开始失控。

第三阶段:理性期。公司开始算账,明确“什么场景该用、什么场景不该用”,建立规则。

大模型现在正处在从“第二阶段”到“第三阶段”的转折点上。Token额度下调,不是公司“不给用了”,而是公司在学习如何聪明地用

这也是健康的。如果放任成本无限增长,最后的结果反而是整个项目被砍掉。现在控制一下,细水长流,对所有人都好。

总结一下

腾讯、字节最近调整内部大模型Token额度,本质上释放了几个信号:

  1. 大模型不再是“免费的午餐”。即使是自家的模型,使用也有成本,而且这个成本正在被量化、被看见、被管理。

  2. “降本增效”进入细颗粒度阶段。从砍人头、砍福利,细化到砍API调用次数。说明公司的成本管理在变得越来越精细。

  3. 员工需要学会“聪明地用AI”。不是所有任务都需要大模型,不是所有大模型调用都需要顶配版。这个认知,正在从“建议”变成“规定”。

对普通员工来说,短期会有些不适。但从长远看,这恰恰说明大模型已经从“花架子”变成了“真工具”——当一个东西开始被严格管起来的时候,恰恰说明它真的有用。

而那些抱怨“额度不够”的人,也许应该问自己一个问题:我之前用掉的那些Token,到底创造了多少真实价值

如果答案是模糊的,那额度降了,也许不是坏事。

http://www.jsqmd.com/news/945380/

相关文章:

  • 基于分布式智能采样与MRF推理的隐私保护交通感知系统
  • AI热潮下一二级市场合并:VC像PE、天使在消失,投资风格巨变!
  • ssm智能卤菜销售平台(10157)
  • 2026年自动剪辑系统怎么用AI实现:从素材处理到成片输出的自动化落地指南 - 广州矩阵架构科技公司
  • 2026年 搪瓷钢板厂家优选榜单:地铁站/隧道/隔音/外墙/双曲弧/木纹/电镀/穿孔搪瓷钢板源头品牌深度解析 - 品牌企业推荐师(官方)
  • 别再让YOLOv8自动选模型了!手把手教你自定义best.pt的评判标准(附权重修改代码)
  • 大气层自定义固件:释放Nintendo Switch全部潜力的开源解决方案
  • 从零到精通:Jellyfin MetaShark插件完整配置与故障排除指南
  • 5分钟搞定抖音内容保存:这个开源工具让你轻松收藏喜欢的视频和直播
  • 2026年基建配套海运集装箱实测评测:桐乡,平湖,湖州,桐乡打包集装箱/桐乡活动板房集装箱/桐乡海运集装箱/桐乡焊接集装箱/选择指南 - 优质品牌商家
  • 理工科论文避坑指南:能精准生成公式图表、参考文献真实可溯源的 5 款 AI 工具实测盘点
  • 【AI推荐系统实战指南】:20年专家亲授5大AI工具与推荐引擎无缝整合的黄金法则
  • Win Server 2019远程桌面多用户登录踩坑实录:从RDPWrap配置到组策略避坑
  • 2026年大型空调主机拆除靠谱公司排名 - myqiye
  • 杰理之打开广播,会报死机【篇】
  • YOLOv5猫狗检测实战:除了训练,你的模型部署和优化思路准备好了吗?
  • 终极指南:如何使用Attu轻松管理你的Milvus向量数据库
  • 深入解析jsdiff:JavaScript文本差异比对的终极解决方案
  • GitHub 上 Stars 最多的 6 个开源 AI 工具:让 AI Agent 更强大
  • 如何有效规避 AutoGPT 架构深度剖析大模型应用中的提示词注入与安全越狱漏洞
  • 重庆家庭水管漏水维修可靠公司排行实测盘点:重庆家庭水管漏水检测维修上门/重庆检测漏水检测/重庆水管漏水检测维修/选择指南 - 优质品牌商家
  • 企业级MR平台AI赋能升级路径(2024 Gartner验证的3层架构模型)
  • AI Agent Harness Engineering 在金融领域的十大应用场景
  • 外呼接通率暴跌?不是号码问题,是AI工具链断点在第3.2秒——基于17.8万通通话日志的根因定位
  • 从Excel规划求解到Python:单纯形法实战,轻松搞定生产排程优化问题
  • AI用于PLC可视化编程,靠谱吗?
  • 2026 清远卫生间漏水、外墙、楼顶、地下室、阳光房渗漏维修师傅推荐|同城附近上门防水补漏公司测评 - 防水百科
  • RapidOCR深度解析:从毫秒级响应到微秒级突破的实时推理架构揭秘
  • 2026 莆田卫生间漏水、外墙、楼顶、地下室、阳光房渗漏维修师傅推荐|同城附近上门防水补漏公司测评 - 防水百科
  • SpringBoot多数据源实战:dynamic-datasource完整配置与最佳实践指南