当前位置：首页 > news >正文

期待实际上手对比DeepSeek V4

news 2026/6/13 18:26:33

想为 DeepSeek V4 寻找第一手的原始数据或参数细节，最可靠的路径是查阅它的官方技术论文及时关注官方公告。

不过，基于截至目前的发布信息和技术社区分享，我可以先为你整理一份核心架构和技术参数的汇总：

两个核心版本的具体参数如下：

版本	总参数	激活参数	上下文	预训练数据
DeepSeek-V4-Pro	1.6 万亿 (1.6T)	490 亿 (49B)	100万 token (1M)	33 万亿 token
DeepSeek-V4-Flash	2840 亿 (284B)	130 亿 (13B)	100万 token (1M)	32 万亿 token

在核心能力上，V4 Pro-Max（最强推理模式）模型在不同任务上表现出色，与顶级闭源模型各有千秋。以下是几个关键评测数据集上的对比 (2026年4月发布) ：

评测基准	评测重点	GPT-5.4	Claude Opus 4.6	Gemini 3.1 Pro	DeepSeek V4 Pro-Max
MMLU-Pro	综合知识	87.5	89.1	91.0	87.5
GPQA Diamond	研究生级问答	93.0	91.3	94.3	90.1
SimpleQA	事实准确性	45.3	46.2	75.6	57.9
HumanEval	代码生成	-	88.8	91.7	93.5
Codeforces	编程竞赛	3168	-	3052	3206
Apex Shortlist	复杂推理	78.1	85.9	89.1	90.2

注：上表为官方或主流评测数据，不同测试条件下的结果可能略有差异。例如在SWE Verified（软件工程）任务上，四款模型的得分均为80.6%，实力相当。

DeepSeek V4 在架构上进行了多项革新，是大幅降低长文本推理成本的关键：

注意力机制：采用DSA2 注意力机制，融合了 DSA (DeepSeek Sparse Attention) 与 NSA 两种稀疏注意力技术，在长文本处理中更高效。
专家模型 (MoE) 结构：使用Mega 内核融合方案，每个 MoE 层包含 384 个专家（如“金融”、“法律”领域的子模型），每次推理会激活其中 6 个进行联合计算。
成本优化技术：
- 单次推理成本：在 1M 上下文设置下，与 V3.2 模型相比，V4-Pro 的推理计算量（FLOPs）降至 27%，KV Cache 显存占用降至10%。V4-Flash 则更为极致，两者分别降至10%和7%。
- 训练与优化：引入Muon 优化器和GRPO强化学习算法等新技术。

模型	输入 (缓存命中)	输入 (缓存未命中)	输出
V4 Pro	1 元	12 元	24 元
V4 Flash	0.2 元	1 元	2 元
V3.2 (对比)	0.2 元	2 元	3 元

开源计划：公司计划于7月24日停止旧模型deepseek-chat和deepseek-reasoner的服务，将它们完全整合至新的V4-Flash模型中。
国产算力：根据公告，华为昇腾芯片将成为V4系列的关键算力提供者。
论文跟进：对于即将发布的完整技术论文，可以关注 DeepSeek 的官方公告和学术平台（如arXiv）。
官方渠道：最权威的信息来源是 DeepSeek 的官方网站、官方公告和 GitHub 仓库。