当前位置: 首页 > news >正文

DeepSeek V4发布

DeepSeek V4 上周就发布了,本来想聊聊,但是之前没想清楚要讲什么。今天就说说令我印象深刻的两个部分。

国产芯片适配。

这里我没有细研究,只挑了几个关键点。

(简单来说,就是优化了国产芯片的推理。还有一个 TileLang,能在代码层适配国产芯片的算子和国外的CUDA)

1M上下文成为标配。

国内的模型除了Qwen,其他的厂商似乎都没有做 1M 的上下文。

标准的注意力机制,每个新来的token都要和前面所有token算一次内积。如果把4K上下文换成100万上下文,需要算的内积数量是4000倍,显存占用也是4000倍。粗略估算下来,100万上下文的单次推理成本比4K高约6万倍。这堵「算力墙」和「显存墙」加起来,是大多数模型在128K-200K就停住的原因。

但这次DeepSeek开放的CSA + HCA,给了一个解决方案。具体内容比较复杂,我也看不太明白,只知道效果大概是这样子。

两者加起来,V4在100万上下文下的单次推理成本,只有V3.2的约1/4。KV cache占用只有传统BF16 GQA8 baseline的约2%

感觉今年年底左右,大家应该也会让 1M 上下文变成模型的基本能力,不再是高价位模型的专属。

之前 Karpathy 分享的知识库管理,其实有个前提,就是模型的上下文要比较大,这样在用起来才比较方便。现在看来,在线的知识管理这种产品应该比较慌了,没必要继续续费~~

还有,RAG的场景进一步被压缩。数据量少的时候直接丢到上下文,数据量大且有多实体关联的时候单纯的RAP没用了,又得加图。

还真印证了那句话,AI时代如果你学得慢,很多东西不用学~

具体技术报告:

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

推荐阅读(非本人):

https://mp.weixin.qq.com/s/BELLFDV6hlmmFoAcJy1RZg

http://www.jsqmd.com/news/951438/

相关文章:

  • 重磅!2026论文AI生成免费工具终极测评榜单,查重不达标全额退款
  • 汽车OTA升级怎么保证安全?从固件签名到密钥全生命周期管理
  • 【jetson】训练图形分类推理模型
  • 衍射级次偏振态的研究
  • 【AI咨询落地实战指南】:20年专家亲授5大智能工具整合框架,错过再等3年?
  • 2026年买不锈钢瓦/铝镁锰瓦/彩石瓦被坑的5大陷阱:金宸伯全部帮你规避》 - 企业深度横评dyy6420
  • 大数据考试
  • OpenClaw + Kubernetes 运维:自动化配置生成,赋能高效应用管理
  • AI驱动的资金调度革命:3步实现转账自动化、风控实时化与审计可追溯化(附银行级API调用清单)
  • 终极优化:swinv2_tiny_window16_256.ms_in1k在NPU与CPU环境下的部署教程
  • 3分钟快速部署:Windows 11 24H2 LTSC应用商店完整解决方案
  • 从‘连连看’到人脸验证:聊聊Siamese Network(孪生神经网络)那些接地气的应用场景
  • 告别“假条截图+人工核验”时代:基于LLM的动态政策推理引擎上线实录(仅限首批200家内测企业)
  • 终极绘图神器:如何在Draw.io中3分钟集成Mermaid图表插件
  • 网卡绑定内核
  • 别再Ctrl+C/V了!Grok清除符号靠这只AI导出鸭救场
  • 大模型安全之数据投毒
  • Python基础 - from import 导入模块中的指定内容
  • 鸿蒙开发-AR画面数据怎么流转?ARFrame数据详解
  • 2026年 模具厂家推荐排行榜:精密模具/非标模具/模具配件/不锈钢精密模具源头工厂实力解析 - 品牌企业推荐师(官方)
  • Deepseek公式乱码?AI导出鸭一键修复格式,精准还原可编辑公式。
  • mysql-索引优化
  • TRAEIDE:开发者高效编程神器
  • 如何用 Codex 建立行业认知框架
  • 从命令行到可视化:SourceGit如何重塑你的Git工作流体验
  • 城市共享单车管理原型设计
  • 2026年不锈钢屋面瓦/铝镁锰瓦/彩石金属瓦北京厂家深度测评:金宸伯断层第一 - 企业深度横评dyy6420
  • TMSpeech:Windows实时语音转文字工具,让会议记录效率提升300%
  • 如何快速上手Xournal++:免费手写笔记软件的完整入门指南
  • Awaking Spatial Intelligence in Unified Multimodal Understanding and Generation