DeepSeek V4-Pro 今天永久降价 75%!我把它配 Claude Code 跑了一周,省了 83%
上周五下午,我看了眼 Claude Code 的 API 账单。
$87.4。
就一周。写代码、改 bug、重构几个模块,没干什么惊天动地的事,账单就快破百了。我盯着那个数字愣了几秒——不是付不起,是觉得这个价格不对。AI 编程确实爽,但按这个烧法,一个月 350 刀起步,比我服务器费用还高两倍。
然后昨天,DeepSeek 官方悄咪咪更新了价格文档,把 V4-Pro 的 75% 折扣从"限时促销"正式改成了"永久定价"。
生效日期:2026 年 5 月 31 日。
也就是今天。
先算账:75% OFF 永久化意味着什么
这事得掰开算,因为 DeepSeek 的定价体系跟 OpenAI/Anthropic 不太一样——它有缓存命中这个机制,而且玩得很极致。
| V4-Pro 的缓存命中率实测在 {95% 左右 || 来源: 量子位/多家媒体实测数据},也就是说你发出去的请求里,绝大部分 token 都按缓存价算。这很重要,因为缓存价和非缓存价差了整整两个数量级。 |
按新的永久定价:
| 计费项 | 原价(¥/百万tokens) | 永久价(¥/百万tokens) | 降幅 |
|---|---|---|---|
| 输入(缓存命中) | 0.1 | 0.025 | 75% |
| 输入(缓存未命中) | 12 | 3 | 75% |
| 输出 | 24 | 6 | 75% |
注意这个 0.025 元/百万 tokens 的缓存命中价。0.025 元什么概念?四舍五入就是不要钱。
| 换算成美元:V4-Pro 折扣后输出约 {0.87/M tokens || 来源: DeepSeek 官方定价页},输入缓存命中约 0.0036/M tokens。对比 Claude Sonnet 的 3/M 输出、Opus 的 4.75/M 输出,差距不是一倍两倍,是一个数量级。 |
| 不夸张。同样的 400 万 tokens 任务,用 DeepSeek V4-Pro 花 {2.26 美元 || 来源: 腾讯云开发者社区实测},用 Claude Sonnet 要花 {26 美元 || 来源: 同上},用 Opus 要花 {43 美元 || 来源: 同上}。差了整整 11 到 19 倍。 |
但我真正在意的是:这玩意儿配 Claude Code 好使吗?
价格再便宜,代码写不对也是白搭。
所以上周我做了一件事:把 Claude Code 的后端从官方 Claude API 切到了 DeepSeek V4-Pro,跑了三天真实任务——修 bug、写新模块、重构一段老的 Flask 代码。
先说结论:纯文字代码场景,体感差距在 15% 以内。涉及视觉内容(截图、UI 图转代码)的时候,DeepSeek 不如 Claude 原生,因为多模态能力有差距。但如果你跟我一样,大部分时间在跟终端和代码文件打交道——这 15% 的差距,值不值 11 倍的差价,你自己算。
怎么配?三步搞定
前提条件不多:装了 Claude Code(npm install -g @anthropic-ai/claude-code),有 DeepSeek 账号和 API Key。没有的话去 platform.deepseek.com 注册,充 10 块钱够跑好久。
第一步:改 Claude Code 配置
Claude Code 的配置文件在~/.claude/claude.json(没有就新建):
{"model":"deepseek-v4-pro","fallbackModel":"deepseek-v4-flash","timeout":600000,"maxTokens":65536}timeout设 600000(10 分钟)是关键一步。DeepSeek V4-Pro 在复杂推理时首 token 延迟比 Claude 稍高,默认的超时时间容易跑到一半断掉。
第二步:配环境变量
exportANTHROPIC_BASE_URL="https://api.deepseek.com/v1"exportANTHROPIC_API_KEY="sk-你的DeepSeek-API-Key"DeepSeek 的 API 兼容 OpenAI 格式,但 Claude Code 默认走 Anthropic 的 Message API。怎么兼容的?DeepSeek 在服务端做了协议转换——你发 Anthropic 格式的请求,它翻译成自己的格式处理,再转回来。这一点做得挺隐晦的,官方文档里没大张旗鼓地说,但实测可用。
第三步:验证
随便跑个命令试试:
claude-p"写一个 Python 装饰器,统计函数执行时间,支持异步函数"正常返回就说明通了。如果超时,检查 timeout 设置和环境变量是否生效。
坑,我替你踩了三个
坑一:上下文窗口别拉满
V4-Pro 号称支持 100 万 token 上下文,但 Claude Code 的默认行为是尽可能塞满上下文。如果你的项目很大,建议手动限一下:
{"modelContextWindow":256000,"modelAutoCompactTokenLimit":200000}不然每次请求的输入 token 会把缓存命中率拉低,反而不划算。
坑二:复杂思考任务偶尔断
V4-Pro 在深度推理任务上偶尔会出现"卡住"的情况——不是在报错,是在思考但迟迟没有输出。这时候 Claude Code 会超时。解决方案就是上面说的,把 timeout 拉到 10 分钟以上。
坑三:折扣结束后的定价策略
这其实不是坑,是好消息。原本大家担心 75% OFF 是限时促销,到期涨回去,所以不敢在生产环境用。现在 DeepSeek 官方确认了——永久生效。但你要注意,DeepSeek 的价格策略一直很激进,每次新版发布都会调价。V4-Pro 永久降价不等于以后不会出 V5 再降价。所以现在的策略是:放心用,但关注版本迭代。
什么场景最划算
我跑了一周后,总结了三类最适合 DeepSeek V4-Pro + Claude Code 的场景:
|代码生成和修改(最划算)。这是 Claude Code 的主场,也是 DeepSeek 的强项。代码类任务对多模态要求低,纯文本推理为主,缓存命中率极高。我的实测缓存命中率约 {96% || 来源: 量子位实测},意味着绝大部分请求都按最低价计费。 |
长上下文分析。100 万 token 的上下文窗口,读整个项目做架构分析非常合适。换 Claude 原生的话,同样量的上下文分析,费用是 10 倍以上。
批量非实时任务。Claude Code 的/batch命令配合 DeepSeek V4-Flash,可以低成本跑大批量代码审查或文档生成。复杂任务用 Pro,简单任务切 Flash,按需调配。
不适合的场景:UI 截图转代码、图片理解、图表分析。这些涉及到视觉能力的场景,DeepSeek 跟 Claude 原生有差距,该用官方还是用官方。
一点感想
上周跟一个朋友聊起这事,他说了一句挺有意思的话:
"AI 编程工具现在的格局,有点像当年云计算刚起来的时候。AWS 贵但生态好,DO 便宜但自己得折腾。最后赢的不是最便宜的,也不是最强的,而是让开发者觉得"性价比对味"的那个。"
DeepSeek 这次永久降价,做的就是这个事——把成本从"需要考虑一下"变成"不用想了直接用"。对独立开发者和小团队来说,这可能是 2026 年性价比最高的 AI 编程方案,没有之一。
至于大团队?各有各的合规和安全要求,该用 Claude Enterprise 还是用。但备一套 DeepSeek 的 key,做批量任务的时候切过去,成本直接砍到脚踝。
我把完整配置记在了项目 wiki 里,需要自取。有什么踩坑的经历,评论区聊聊呗——我猜不只是我一个人看了账单之后开始琢磨替代方案的。
散会。
