当前位置：首页 > news >正文

Deepseek融资5000亿后首推DSpark框架，高并发下大模型响应速度显著提升！

news 2026/6/30 0:05:29

【导语：近日，Deepseek团队在GitHub上线论文，提出DSpark框架解决大模型高并发下响应速度问题。该框架由北大和Deepseek联合出品，开源代码和权重，测试效果显著，虽有局限但传递出竞争新信号。】

DSpark框架解决高并发难题

Deepseek团队发布的论文聚焦大模型在高并发下保持响应速度这一真实生产问题。提出的DSpark框架由北京大学和DeepSeek联合出品，训练代码和模型权重全在GitHub的DeepSpec仓库。其论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi - Autoregressive Generation》于6月27日发布。

突破现有推测解码缺陷

推测解码并非新概念，但现有实现存在明显缺陷，一是草稿模型生成到后面token存活率下降，二是验证环节算力分配一刀切。DSpark给出针对性解法，半自回归生成让并行主干网络输出候选token基础特征，轻量顺序模块逐token补充依赖关系，2层结构比5层传统并行模型候选序列有效生成长度还长。

置信度调度验证则根据实时算力负载和前缀存活概率，动态决定每个请求验证的序列长度，优先验证高质量候选，截断大概率被拒的token。

测试效果全面领先竞品

在离线基准测试中，DSpark全面领先Eagle3和DFlash。以Qwen3 - 4B为例，单轮有效生成长度比Eagle3高出30.9%，比DFlash高出16.3%。线上A/B测试更具说服力，V4 - Flash在80 token/s的SLA条件下吞吐量提升51%，SLA拉紧到120 token/s时吞吐量提升661%；V4 - Pro在35 token/s下提升52%，50 token/s下提升406%。

同时，单用户生成速度改善60%到85%，在API产品里意味着等待时间几乎减半。

局限与竞争新信号

论文也指出DSpark的局限，在复杂低适配查询场景下，完整候选块生成有固定算力开销且无法回收。不过，DeepSeek刚完成首轮融资，投后估值5000亿，融资后首周放出合作论文和开源代码，传递出想将模型推理效率赛道从产品竞争变为基础设施竞争的信号。

编辑观点：DSpark框架为大模型高并发响应问题提供有效解决方案，开源策略有望推动行业发展，但局限也需后续优化。

http://www.jsqmd.com/news/1092564/

相关文章：

cci-job-client架构设计解析：Python脚本如何简化LKP测试流程

一台电脑，四人同屏：Nucleus Co-Op如何让你的游戏派对更精彩？

如何在1分钟内为Windows安装苹果USB网络共享驱动：完整解决方案

Win11Debloat架构解析：模块化注册表管理实现Windows系统深度优化

FPGA实战指南：从信号采样到频谱分析的FFT IP核全流程解析

实战指南：SPOT数据获取、波段解析与多光谱模拟真彩色合成技术详解

1 安装免费 Python PDF 库

Memlink在aarch64架构上的应用：打造高效能ARM云平台内存方案

MSPM0 G系列SYSCTL模块深度解析：时钟配置、低功耗模式与实战避坑指南

LinkSwift：免费开源网盘下载加速工具，一键获取九大平台直链

从 Python 神经网络到完整 FPGA RTL：MNIST 手写数字项目全自动化生成实战

Avalonia中的动画

基于FPGA实现LVDS_7to1接口显示屏显示

Google限制Meta使用Gemini模型凸显AI授权竞争白热化

openEuler双桌面环境实战：从ukui到dde的安装与多模式切换指南

报社登报声明一般多少钱？办理登报声明的流程怎么走？

BiliTools：一款让你高效管理B站资源的跨平台工具箱

NoFences：你的Windows桌面需要一场空间革命吗？

2026 年全球首个自动驾驶法规获批，终结标准割裂，中国深度参与重塑产业格局

【计算机毕业设计案例】基于 Spring Boot+Vue 的电影售票系统设计与实现前后端分离架构下影院在线购票管理平台(程序+文档+讲解+定制)

抓“静电”痕：ESD失效分析技术实战

到底 TMD 用哪个: npm, pnpm, Yarn, Bun, Deno? 傻瓜, 当然用 npm 啦

为什么需要一个“闭环“

2026年数据安全评估师认证：五位一体技术体系深度解析

如何用BiliTools轻松管理你的B站数字资产？3大核心功能深度解析

使用第三方 API 时保留 Codex 远程操作和官方插件：CC Switch 配置攻略

从零搭建HTTPS双向认证：Nginx+Spring Boot实战与证书管理

C# 与 OpenTK：从入门到实战，构建你的第一个3D图形应用

3大实用场景+40+模板：Dify工作流宝库让AI应用开发像搭积木一样简单

当 Alpha 开始影响价格：SEER 如何用符号回归拆出非线性市场冲击