当前位置：首页 > news >正文

DeepSeek V4-Pro 今天永久降价 75%！我把它配 Claude Code 跑了一周，省了 83%

news 2026/7/22 6:26:22

上周五下午，我看了眼 Claude Code 的 API 账单。

$87.4。

就一周。写代码、改 bug、重构几个模块，没干什么惊天动地的事，账单就快破百了。我盯着那个数字愣了几秒——不是付不起，是觉得这个价格不对。AI 编程确实爽，但按这个烧法，一个月 350 刀起步，比我服务器费用还高两倍。

然后昨天，DeepSeek 官方悄咪咪更新了价格文档，把 V4-Pro 的 75% 折扣从"限时促销"正式改成了"永久定价"。

生效日期：2026 年 5 月 31 日。

也就是今天。

先算账：75% OFF 永久化意味着什么

这事得掰开算，因为 DeepSeek 的定价体系跟 OpenAI/Anthropic 不太一样——它有缓存命中这个机制，而且玩得很极致。

| V4-Pro 的缓存命中率实测在 {95% 左右 || 来源: 量子位/多家媒体实测数据}，也就是说你发出去的请求里，绝大部分 token 都按缓存价算。这很重要，因为缓存价和非缓存价差了整整两个数量级。 |

按新的永久定价：

计费项	原价（¥/百万tokens）	永久价（¥/百万tokens）	降幅
输入（缓存命中）	0.1	0.025	75%
输入（缓存未命中）	12	3	75%
输出	24	6	75%

注意这个 0.025 元/百万 tokens 的缓存命中价。0.025 元什么概念？四舍五入就是不要钱。

| 换算成美元：V4-Pro 折扣后输出约 {0.87/M tokens || 来源: DeepSeek 官方定价页}，输入缓存命中约 0.0036/M tokens。对比 Claude Sonnet 的 3/M 输出、Opus 的 4.75/M 输出，差距不是一倍两倍，是一个数量级。 |

| 不夸张。同样的 400 万 tokens 任务，用 DeepSeek V4-Pro 花 {2.26 美元 || 来源: 腾讯云开发者社区实测}，用 Claude Sonnet 要花 {26 美元 || 来源: 同上}，用 Opus 要花 {43 美元 || 来源: 同上}。差了整整 11 到 19 倍。 |

但我真正在意的是：这玩意儿配 Claude Code 好使吗？

价格再便宜，代码写不对也是白搭。

所以上周我做了一件事：把 Claude Code 的后端从官方 Claude API 切到了 DeepSeek V4-Pro，跑了三天真实任务——修 bug、写新模块、重构一段老的 Flask 代码。

先说结论：纯文字代码场景，体感差距在 15% 以内。涉及视觉内容（截图、UI 图转代码）的时候，DeepSeek 不如 Claude 原生，因为多模态能力有差距。但如果你跟我一样，大部分时间在跟终端和代码文件打交道——这 15% 的差距，值不值 11 倍的差价，你自己算。

怎么配？三步搞定

前提条件不多：装了 Claude Code（npm install -g @anthropic-ai/claude-code），有 DeepSeek 账号和 API Key。没有的话去 platform.deepseek.com 注册，充 10 块钱够跑好久。

第一步：改 Claude Code 配置

Claude Code 的配置文件在~/.claude/claude.json（没有就新建）：

{"model":"deepseek-v4-pro","fallbackModel":"deepseek-v4-flash","timeout":600000,"maxTokens":65536}

timeout设 600000（10 分钟）是关键一步。DeepSeek V4-Pro 在复杂推理时首 token 延迟比 Claude 稍高，默认的超时时间容易跑到一半断掉。

第二步：配环境变量

exportANTHROPIC_BASE_URL="https://api.deepseek.com/v1"exportANTHROPIC_API_KEY="sk-你的DeepSeek-API-Key"

DeepSeek 的 API 兼容 OpenAI 格式，但 Claude Code 默认走 Anthropic 的 Message API。怎么兼容的？DeepSeek 在服务端做了协议转换——你发 Anthropic 格式的请求，它翻译成自己的格式处理，再转回来。这一点做得挺隐晦的，官方文档里没大张旗鼓地说，但实测可用。

第三步：验证

随便跑个命令试试：

claude-p"写一个 Python 装饰器，统计函数执行时间，支持异步函数"

正常返回就说明通了。如果超时，检查 timeout 设置和环境变量是否生效。

坑，我替你踩了三个

坑一：上下文窗口别拉满

V4-Pro 号称支持 100 万 token 上下文，但 Claude Code 的默认行为是尽可能塞满上下文。如果你的项目很大，建议手动限一下：

{"modelContextWindow":256000,"modelAutoCompactTokenLimit":200000}

不然每次请求的输入 token 会把缓存命中率拉低，反而不划算。

坑二：复杂思考任务偶尔断

V4-Pro 在深度推理任务上偶尔会出现"卡住"的情况——不是在报错，是在思考但迟迟没有输出。这时候 Claude Code 会超时。解决方案就是上面说的，把 timeout 拉到 10 分钟以上。

坑三：折扣结束后的定价策略

这其实不是坑，是好消息。原本大家担心 75% OFF 是限时促销，到期涨回去，所以不敢在生产环境用。现在 DeepSeek 官方确认了——永久生效。但你要注意，DeepSeek 的价格策略一直很激进，每次新版发布都会调价。V4-Pro 永久降价不等于以后不会出 V5 再降价。所以现在的策略是：放心用，但关注版本迭代。