当前位置: 首页 > news >正文

DeepSeek V4-Pro 今天永久降价 75%!我把它配 Claude Code 跑了一周,省了 83%

上周五下午,我看了眼 Claude Code 的 API 账单。

$87.4。

就一周。写代码、改 bug、重构几个模块,没干什么惊天动地的事,账单就快破百了。我盯着那个数字愣了几秒——不是付不起,是觉得这个价格不对。AI 编程确实爽,但按这个烧法,一个月 350 刀起步,比我服务器费用还高两倍。

然后昨天,DeepSeek 官方悄咪咪更新了价格文档,把 V4-Pro 的 75% 折扣从"限时促销"正式改成了"永久定价"。

生效日期:2026 年 5 月 31 日。

也就是今天。


先算账:75% OFF 永久化意味着什么

这事得掰开算,因为 DeepSeek 的定价体系跟 OpenAI/Anthropic 不太一样——它有缓存命中这个机制,而且玩得很极致。

| V4-Pro 的缓存命中率实测在 {95% 左右 || 来源: 量子位/多家媒体实测数据},也就是说你发出去的请求里,绝大部分 token 都按缓存价算。这很重要,因为缓存价和非缓存价差了整整两个数量级。 |

按新的永久定价:

计费项原价(¥/百万tokens)永久价(¥/百万tokens)降幅
输入(缓存命中)0.10.02575%
输入(缓存未命中)12375%
输出24675%

注意这个 0.025 元/百万 tokens 的缓存命中价。0.025 元什么概念?四舍五入就是不要钱。

| 换算成美元:V4-Pro 折扣后输出约 {0.87/M tokens || 来源: DeepSeek 官方定价页},输入缓存命中约 0.0036/M tokens。对比 Claude Sonnet 的 3/M 输出、Opus 的 4.75/M 输出,差距不是一倍两倍,是一个数量级。 |

| 不夸张。同样的 400 万 tokens 任务,用 DeepSeek V4-Pro 花 {2.26 美元 || 来源: 腾讯云开发者社区实测},用 Claude Sonnet 要花 {26 美元 || 来源: 同上},用 Opus 要花 {43 美元 || 来源: 同上}。差了整整 11 到 19 倍。 |

但我真正在意的是:这玩意儿配 Claude Code 好使吗?

价格再便宜,代码写不对也是白搭。

所以上周我做了一件事:把 Claude Code 的后端从官方 Claude API 切到了 DeepSeek V4-Pro,跑了三天真实任务——修 bug、写新模块、重构一段老的 Flask 代码。

先说结论:纯文字代码场景,体感差距在 15% 以内。涉及视觉内容(截图、UI 图转代码)的时候,DeepSeek 不如 Claude 原生,因为多模态能力有差距。但如果你跟我一样,大部分时间在跟终端和代码文件打交道——这 15% 的差距,值不值 11 倍的差价,你自己算。


怎么配?三步搞定

前提条件不多:装了 Claude Code(npm install -g @anthropic-ai/claude-code),有 DeepSeek 账号和 API Key。没有的话去 platform.deepseek.com 注册,充 10 块钱够跑好久。

第一步:改 Claude Code 配置

Claude Code 的配置文件在~/.claude/claude.json(没有就新建):

{"model":"deepseek-v4-pro","fallbackModel":"deepseek-v4-flash","timeout":600000,"maxTokens":65536}

timeout设 600000(10 分钟)是关键一步。DeepSeek V4-Pro 在复杂推理时首 token 延迟比 Claude 稍高,默认的超时时间容易跑到一半断掉。

第二步:配环境变量

exportANTHROPIC_BASE_URL="https://api.deepseek.com/v1"exportANTHROPIC_API_KEY="sk-你的DeepSeek-API-Key"

DeepSeek 的 API 兼容 OpenAI 格式,但 Claude Code 默认走 Anthropic 的 Message API。怎么兼容的?DeepSeek 在服务端做了协议转换——你发 Anthropic 格式的请求,它翻译成自己的格式处理,再转回来。这一点做得挺隐晦的,官方文档里没大张旗鼓地说,但实测可用。

第三步:验证

随便跑个命令试试:

claude-p"写一个 Python 装饰器,统计函数执行时间,支持异步函数"

正常返回就说明通了。如果超时,检查 timeout 设置和环境变量是否生效。


坑,我替你踩了三个

坑一:上下文窗口别拉满

V4-Pro 号称支持 100 万 token 上下文,但 Claude Code 的默认行为是尽可能塞满上下文。如果你的项目很大,建议手动限一下:

{"modelContextWindow":256000,"modelAutoCompactTokenLimit":200000}

不然每次请求的输入 token 会把缓存命中率拉低,反而不划算。

坑二:复杂思考任务偶尔断

V4-Pro 在深度推理任务上偶尔会出现"卡住"的情况——不是在报错,是在思考但迟迟没有输出。这时候 Claude Code 会超时。解决方案就是上面说的,把 timeout 拉到 10 分钟以上。

坑三:折扣结束后的定价策略

这其实不是坑,是好消息。原本大家担心 75% OFF 是限时促销,到期涨回去,所以不敢在生产环境用。现在 DeepSeek 官方确认了——永久生效。但你要注意,DeepSeek 的价格策略一直很激进,每次新版发布都会调价。V4-Pro 永久降价不等于以后不会出 V5 再降价。所以现在的策略是:放心用,但关注版本迭代。


什么场景最划算

我跑了一周后,总结了三类最适合 DeepSeek V4-Pro + Claude Code 的场景:

|代码生成和修改(最划算)。这是 Claude Code 的主场,也是 DeepSeek 的强项。代码类任务对多模态要求低,纯文本推理为主,缓存命中率极高。我的实测缓存命中率约 {96% || 来源: 量子位实测},意味着绝大部分请求都按最低价计费。 |

长上下文分析。100 万 token 的上下文窗口,读整个项目做架构分析非常合适。换 Claude 原生的话,同样量的上下文分析,费用是 10 倍以上。

批量非实时任务。Claude Code 的/batch命令配合 DeepSeek V4-Flash,可以低成本跑大批量代码审查或文档生成。复杂任务用 Pro,简单任务切 Flash,按需调配。

不适合的场景:UI 截图转代码、图片理解、图表分析。这些涉及到视觉能力的场景,DeepSeek 跟 Claude 原生有差距,该用官方还是用官方。


一点感想

上周跟一个朋友聊起这事,他说了一句挺有意思的话:

"AI 编程工具现在的格局,有点像当年云计算刚起来的时候。AWS 贵但生态好,DO 便宜但自己得折腾。最后赢的不是最便宜的,也不是最强的,而是让开发者觉得"性价比对味"的那个。"

DeepSeek 这次永久降价,做的就是这个事——把成本从"需要考虑一下"变成"不用想了直接用"。对独立开发者和小团队来说,这可能是 2026 年性价比最高的 AI 编程方案,没有之一。

至于大团队?各有各的合规和安全要求,该用 Claude Enterprise 还是用。但备一套 DeepSeek 的 key,做批量任务的时候切过去,成本直接砍到脚踝。

我把完整配置记在了项目 wiki 里,需要自取。有什么踩坑的经历,评论区聊聊呗——我猜不只是我一个人看了账单之后开始琢磨替代方案的。

散会。

http://www.jsqmd.com/news/931342/

相关文章:

  • 基于ESP32与LoRa的土壤监测网关:从硬件连接到代码实现的完整指南
  • 3大优势揭秘:这款开源工具如何成为华硕笔记本臃肿软件的完美替代方案
  • 别再死记硬背了!用MATLAB和Keras手把手拆解1DCNN,搞懂时序数据处理的底层逻辑
  • 用sklearn的SVR预测股票价格?一个从数据生成到模型评估的完整项目复盘
  • 电商个性化推荐系统:从算法原理到工程实践,避开四大实施陷阱
  • Avidemux视频编辑:5分钟掌握开源剪辑神器的高效实用指南
  • 2026蚌埠母婴除甲醛公司TOP5深度测评:5大优选甲醛检测治理品牌 - 诚信金利回收
  • Sora 2虚拟会议背景如何重构远程协作体验:2024年实测8大行业落地数据与性能基准报告
  • 手把手教你安装MestReNova,MestReNova安装教程,14版本
  • 如何用HS2-HF_Patch彻底改变你的Honey Select 2游戏体验:终极优化指南
  • MATLAB粒子群算法机器人路径规划实战包:含动态避障仿真、中文注释代码与操作视频
  • 基于Arduino与电磁铁的盲文阅读器:从编码到触觉的硬件实现
  • 3步破解:REPENTOGON深度架构解析与高级配置指南
  • 如何快速掌握网页资源嗅探:猫抓插件的完整使用指南
  • 在Windows上安装Android应用的终极指南:APK Installer完全免费解决方案
  • 2026包头母婴除甲醛公司TOP5深度测评:5大优选甲醛检测治理品牌 - 诚信金利回收
  • 强化学习完全指南:从试错到自主决策的智能进化
  • Obsidian研究助手:科研人员的数字大脑搭建指南
  • 汕头车韵汽车音响改装店亲测2026年5月,效果翻倍 - GrowthUME
  • 深度学习完全指南:从神经元到大模型的全栈演进
  • RK3588 启动阶段 `rockchip_panel_probe -19` 真实根因排查与修复实战
  • 2026宝鸡母婴除甲醛公司TOP5深度测评:5大优选甲醛检测治理品牌 - 诚信金利回收
  • YimMenu:GTA5游戏保护与功能增强终极指南
  • Sora 2生成的沙发会“塌陷”?深度解析家具结构物理约束缺失问题及Blender+NeRF联合修复方案
  • Sora 2如何规避A柱盲区可视化误差?——基于ISO 15007-2:2023标准的8类光学畸变校准方案
  • Title: 效率飞跃!用 Qwen3.6-35B 打造专属「万能提示词生成器」,拒绝垃圾输出!
  • 2026年度国产品牌在线DO仪源头厂家权威推荐榜:十大品牌综合实力深度测评与选型指南 - 仪表品牌榜
  • 2026保定母婴除甲醛公司TOP5深度测评:5大优选甲醛检测治理品牌 - 诚信金利回收
  • 2025-2026年全球ai写小说软件测评推荐:五大排行产品专业评测夜写灵感枯竭性价比高注意事项
  • 自制高压探头:从分压原理到安全实践,精准测量高电压