当前位置：首页 > news >正文

豆包月费500，DeepSeek打骨折：定价逻辑裂了

news 2026/6/25 15:22:41

6月24日，月活3.45亿的豆包正式推出专业版：68/200/500元三档包月。免费版保留，但高算力功能——Agent操作电脑、Office套件、视频生成——进了收费套餐。

就在此前两周，DeepSeek把V4-Pro API价格永久砍到原来的1/4，腾讯云跟进（缓存命中价打97.5%折扣），小米MiMo直接降99%。现在一块钱能让AI跑4000-5000次标准问答。

同一个6月，中国的AI产品在搞三种完全相反的定价：有人开始收钱，有人打到骨折，还有人连涨三回。

路线一：C端开始收钱

豆包不是突然想收费。它是被迫的。

字节去年在AI上砸了1500亿元，利润跌了70%。今年预算调到了2000亿以上。豆包每天处理180万亿Token，按输出价30元/百万Token算，仅推理成本一天就烧掉50多亿。

据媒体报道，此前豆包每天靠电商佣金赚几十万元，但每天的服务成本是几千万。每多一个免费用户，就多一份刚性算力支出——AI的边际成本不是零，尤其是Agent这种重算力任务。

所以收费方案设计得很精细：聊天继续免费，高算力功能进68元起步的套餐。大学生第一学期38元。视障人群有特殊方案。

字节不是对所有用户收费——是只对"把AI当生产力工具用"的人收费。

路线二：B端Token打到骨折

开发者那边，完全是另一个世界。5月22日DeepSeek V4-Pro API永久降价75%，5月27日小米MiMo-V2.5跟进降99%，6月2日腾讯云把平台上的DeepSeek-V4价格拉到官方水平（最高降97.5%）。

同样输出100万Token，DeepSeek只要6块，GPT-5.4要108块，Claude要180块。海外在涨价，国内在往下砸。

路线三：限购涨价

同一个6月，智谱的API套餐天天得抢，一年涨了三次价。Kimi、MiniMax的接口接连过载，开发者排着队"等Token"。

最荒诞的一幕：MiniMax发布主打智能体的M3的同一天，把用了多年的包月计费改成了按Token计费——重度用户成本直接翻倍。

卖的都是Token，处境完全不同。DeepSeek靠自研推理引擎压低成本，降得起；豆包有3.45亿月活分摊算力，敢收费。夹在中间的——没有自研引擎优化成本、也没有C端规模兜底——只能靠限购和涨价硬扛产能天花板。

三种定价不是逻辑打架——是AI产业链在分层。底层Token正在变成大宗商品，谁成本低谁活；上层C端应用开始把AI当生产力工具卖；中间那些既没自研能力压低成本、也没用户规模兜底的公司，被挤在夹缝里。

为什么三条路线会同时出现

答案藏在两个数字里。

第一个数字：1400倍。中国日均Token调用量，从2024年初的1000亿涨到2025年底的100万亿，今年3月突破140万亿——两年涨了1400倍。

聊天一次几万个Token。但一个编程Agent啃代码库、跑命令、反复自检——MiniMax演示M3独立跑一篇论文，自主折腾了12小时。这类任务的Token消耗是聊天的几十上百倍。

需求爆炸式增长，产能跟不上。Token从"无限复制的数字产品"变成了"有物理产能上限的工业品"。智谱和Kimi限购不是耍大牌——是产线满了。

第二个数字：2.45万亿美元。一篇NBER论文算了笔冷酷的账：亚马逊、谷歌、微软、Meta、甲骨文五家公司，2024到2027年在AI基建上要砸2.45万亿美元。如果AI的生产力不在五年内提升169%，这五家公司面临"史上最大的资本错配"——换句话说，破产风险。

这不是吓人。xAI一个季度亏掉25亿美元，收入才8亿出头——规模上去，亏损反而加速。全球九大云厂商2026年合计资本开支8300亿美元，增速从61%跳到79%。这不是投资，是军备竞赛。

在中国，字节的处境最典型：3.45亿月活，日耗180万亿Token，AI预算2000亿。不停下烧钱，用户越多亏越狠。不收钱，账就算不过来。

三条定价路线的底层逻辑：AI不再是一个"写代码就能多卖一份"的数字产品了。它变成了一笔重资产生意，每一个Token背后都有真实的电费、芯片折旧和机房租金。

爻枢视角

中小企业面对这场定价分裂，信号其实很清晰：AI免费的时代结束了，以后一切都要算账。真正贵的不是调用一次模型——API已经被砸到地板了——而是把AI嵌入业务流程的隐性成本：数据清洗、系统对接、持续运维。

爻枢做的就是把这层隐性成本压到零：企业不用自己搭中台、不用养数据工程师，接上就能用。当市场开始为AI认真付费，说明结果被承认了——这是好事。

一句话结论

2026年6月，中国AI最深的信号不是谁降了97.5%或谁开始收500块——而是"免费"这件皇帝的新衣，终于被扯下来了。

查看全文

http://www.jsqmd.com/news/1075569/

【应用方案】一文搞定！压电马达核心技术、驱动流程与国产芯片配套方案详解

植物叶片病害识别：小样本迁移学习与边缘端轻量化部署实战

AI时代漏洞管理困境：从海量告警到风险驱动的自适应安全体系

QuickRecorder终极指南：免费开源macOS屏幕录制神器

批量下载SCIE论文并导入至zotero中

开源项目吐槽大会：一场技术、社区与文化的坦诚对话

企业数字化管理是什么，如何建立企业数字化管理？

戴森电池开源固件改造终极指南：解锁隐藏功能实现设备延寿

Triton模型服务化实战：生产级AI推理的可观测性与弹性设计

kind：用 Docker 跑本地 Kubernetes 集群

如何快速清理Windows 11系统臃肿：完整优化指南

机器学习中的导数：从链式法则到自动微分的工程实践

Kimi LeetCode 3373. 连接两棵树后最大目标节点数目 II Rust实现

Neovim：十多万 Star 的编辑器，到底在改什么

信创财务系统适配难？实测AI智能体，国产软硬件全栈落地避坑指南

轻量级大模型边缘部署：Open Assistant工程实践指南

NXP Layerscape安全启动机制深度解析：从SRK表到错误码排错

锋芒尽显|搭载AMD 6600H暴雨BJB200笔记本正式发布

IT AI建站：从丰田生产线到数字创作的新范式

微信聊天记录永久保存方案：用WeChatMsg打造个人数字记忆库

为什么同样卖秋冬服装，有人爆单有人库存积压？

【Netty源码解读和权威指南】第49篇：Netty实战——开发高性能im即时通讯系统

（文末附skill资源）基于QClaw创建一个输入视频链接提取视频音频为文本的skill

华硕笔记本性能调优神器：G-Helper全面解析与实用指南

DBeaver如何转储数据库（导出）

JMeter 2.6多线程压力测试实战指南：从脚本设计到结果分析

一款Python语言Django框架DDD脚手架，适合快速搭建项目

株洲零界传媒：专注GEO优化的AI品牌服务商

上海AI智能体培训机构推荐：如何选择适合自己的AI学习平台

构建能理解if/else条件逻辑的聊天机器人