当前位置: 首页 > news >正文

豆包月费500,DeepSeek打骨折:定价逻辑裂了

6月24日,月活3.45亿的豆包正式推出专业版:68/200/500元三档包月。免费版保留,但高算力功能——Agent操作电脑、Office套件、视频生成——进了收费套餐。

就在此前两周,DeepSeek把V4-Pro API价格永久砍到原来的1/4,腾讯云跟进(缓存命中价打97.5%折扣),小米MiMo直接降99%。现在一块钱能让AI跑4000-5000次标准问答。

同一个6月,中国的AI产品在搞三种完全相反的定价:有人开始收钱,有人打到骨折,还有人连涨三回。

路线一:C端开始收钱

豆包不是突然想收费。它是被迫的。

字节去年在AI上砸了1500亿元,利润跌了70%。今年预算调到了2000亿以上。豆包每天处理180万亿Token,按输出价30元/百万Token算,仅推理成本一天就烧掉50多亿。

据媒体报道,此前豆包每天靠电商佣金赚几十万元,但每天的服务成本是几千万。每多一个免费用户,就多一份刚性算力支出——AI的边际成本不是零,尤其是Agent这种重算力任务。

所以收费方案设计得很精细:聊天继续免费,高算力功能进68元起步的套餐。大学生第一学期38元。视障人群有特殊方案。

字节不是对所有用户收费——是只对"把AI当生产力工具用"的人收费。

路线二:B端Token打到骨折

开发者那边,完全是另一个世界。5月22日DeepSeek V4-Pro API永久降价75%,5月27日小米MiMo-V2.5跟进降99%,6月2日腾讯云把平台上的DeepSeek-V4价格拉到官方水平(最高降97.5%)。

同样输出100万Token,DeepSeek只要6块,GPT-5.4要108块,Claude要180块。海外在涨价,国内在往下砸。

路线三:限购涨价

同一个6月,智谱的API套餐天天得抢,一年涨了三次价。Kimi、MiniMax的接口接连过载,开发者排着队"等Token"。

最荒诞的一幕:MiniMax发布主打智能体的M3的同一天,把用了多年的包月计费改成了按Token计费——重度用户成本直接翻倍。

卖的都是Token,处境完全不同。DeepSeek靠自研推理引擎压低成本,降得起;豆包有3.45亿月活分摊算力,敢收费。夹在中间的——没有自研引擎优化成本、也没有C端规模兜底——只能靠限购和涨价硬扛产能天花板。

三种定价不是逻辑打架——是AI产业链在分层。底层Token正在变成大宗商品,谁成本低谁活;上层C端应用开始把AI当生产力工具卖;中间那些既没自研能力压低成本、也没用户规模兜底的公司,被挤在夹缝里。

为什么三条路线会同时出现

答案藏在两个数字里。

第一个数字:1400倍。中国日均Token调用量,从2024年初的1000亿涨到2025年底的100万亿,今年3月突破140万亿——两年涨了1400倍。

聊天一次几万个Token。但一个编程Agent啃代码库、跑命令、反复自检——MiniMax演示M3独立跑一篇论文,自主折腾了12小时。这类任务的Token消耗是聊天的几十上百倍。

需求爆炸式增长,产能跟不上。Token从"无限复制的数字产品"变成了"有物理产能上限的工业品"。智谱和Kimi限购不是耍大牌——是产线满了。

第二个数字:2.45万亿美元。一篇NBER论文算了笔冷酷的账:亚马逊、谷歌、微软、Meta、甲骨文五家公司,2024到2027年在AI基建上要砸2.45万亿美元。如果AI的生产力不在五年内提升169%,这五家公司面临"史上最大的资本错配"——换句话说,破产风险。

这不是吓人。xAI一个季度亏掉25亿美元,收入才8亿出头——规模上去,亏损反而加速。全球九大云厂商2026年合计资本开支8300亿美元,增速从61%跳到79%。这不是投资,是军备竞赛。

在中国,字节的处境最典型:3.45亿月活,日耗180万亿Token,AI预算2000亿。不停下烧钱,用户越多亏越狠。不收钱,账就算不过来。

三条定价路线的底层逻辑:AI不再是一个"写代码就能多卖一份"的数字产品了。它变成了一笔重资产生意,每一个Token背后都有真实的电费、芯片折旧和机房租金。

爻枢视角

中小企业面对这场定价分裂,信号其实很清晰:AI免费的时代结束了,以后一切都要算账。真正贵的不是调用一次模型——API已经被砸到地板了——而是把AI嵌入业务流程的隐性成本:数据清洗、系统对接、持续运维。

爻枢做的就是把这层隐性成本压到零:企业不用自己搭中台、不用养数据工程师,接上就能用。当市场开始为AI认真付费,说明结果被承认了——这是好事。

一句话结论

2026年6月,中国AI最深的信号不是谁降了97.5%或谁开始收500块——而是"免费"这件皇帝的新衣,终于被扯下来了。

http://www.jsqmd.com/news/1075569/

相关文章:

  • 【应用方案】一文搞定!压电马达核心技术、驱动流程与国产芯片配套方案详解
  • 植物叶片病害识别:小样本迁移学习与边缘端轻量化部署实战
  • AI时代漏洞管理困境:从海量告警到风险驱动的自适应安全体系
  • QuickRecorder终极指南:免费开源macOS屏幕录制神器
  • 批量下载SCIE论文并导入至zotero中
  • 开源项目吐槽大会:一场技术、社区与文化的坦诚对话
  • 企业数字化管理是什么,如何建立企业数字化管理?
  • 戴森电池开源固件改造终极指南:解锁隐藏功能实现设备延寿
  • Triton模型服务化实战:生产级AI推理的可观测性与弹性设计
  • kind:用 Docker 跑本地 Kubernetes 集群
  • 如何快速清理Windows 11系统臃肿:完整优化指南
  • 机器学习中的导数:从链式法则到自动微分的工程实践
  • Kimi LeetCode 3373. 连接两棵树后最大目标节点数目 II Rust实现
  • Neovim:十多万 Star 的编辑器,到底在改什么
  • 信创财务系统适配难?实测AI智能体,国产软硬件全栈落地避坑指南
  • 轻量级大模型边缘部署:Open Assistant工程实践指南
  • NXP Layerscape安全启动机制深度解析:从SRK表到错误码排错
  • 锋芒尽显|搭载AMD 6600H暴雨BJB200笔记本正式发布
  • IT AI建站:从丰田生产线到数字创作的新范式
  • 微信聊天记录永久保存方案:用WeChatMsg打造个人数字记忆库
  • 为什么同样卖秋冬服装,有人爆单有人库存积压?
  • 【Netty源码解读和权威指南】第49篇:Netty实战——开发高性能im即时通讯系统
  • (文末附skill资源)基于QClaw创建一个输入视频链接提取视频音频为文本的skill
  • 华硕笔记本性能调优神器:G-Helper全面解析与实用指南
  • DBeaver如何转储数据库(导出)
  • JMeter 2.6多线程压力测试实战指南:从脚本设计到结果分析
  • 一款Python语言Django框架DDD脚手架,适合快速搭建项目
  • 株洲零界传媒:专注GEO优化的AI品牌服务商
  • 上海AI智能体培训机构推荐:如何选择适合自己的AI学习平台
  • 构建能理解if/else条件逻辑的聊天机器人