当前位置: 首页 > news >正文

2026 年 DeepSeek 融资与 V4 发布:国产 AI 算力自主挑战与机遇并存

国产替代和推理跃进,V4 的新故事

2026 年 4 月,DeepSeek 几乎同时公布两条大新闻,一是启动首次外部融资,目标估值从 100 亿美元抬升至 200 - 300 亿美元,腾讯、阿里正洽谈入局;二是新一代旗舰模型 V4 发布,全面适配华为昇腾 950PR 芯片,从英伟达的 CUDA 生态转向华为的 CANN 框架。

2026 年 4 月 24 日,DeepSeek V4 发布,这不是常规模型迭代。新模型总参数推至 1.6 万亿,首次将百万 token 上下文打成标配,百万上下文下每 token 算力消耗仅为 V3.2 的 27%,KV 缓存占用只有 10%。模型输出质量上,V4 支持三档推理强度,针对 Agentic Coding 做专项优化,内部评测显示交付质量接近 Claude Opus 4.6 的非思考模式。V4 首次在官方技术报告中,把国产芯片和英伟达 GPU 写进同一份硬件验证清单。

V4 适配的华为昇腾 950PR 推理芯片于 2026 年 3 月量产,单卡算力较英伟达对华特供版 H20 提升 2.87 倍。目前,阿里巴巴、字节跳动、腾讯等已向华为下单数十万颗昇腾芯片。从成本看,昇腾 950PR 采购价格约为英伟达 H200 的三分之一到四分之一,绝对算力是 H200 的一半,性价比高。在低精度推理场景下,华为昇腾 950PR 有超越通用 GPU 的效率。

2026 年 3 月的 GTC 大会上,黄仁勋宣布推理拐点到来,需求不断增长,过去两年 AI 计算需求激增 1 万倍,行业重心从模型训练转向推理服务。4 月 15 日,他在彭博社播客访谈中反驳相关说法,警告过度限制会逼中国建立自主生态。

跳出英伟达架构有风险,CANN 架构不成熟,第三方库支持、调试工具链不及 CUDA,个人开发者和小团队迁移门槛存在。但如果 V4 在华为芯片上性能有竞争力,中国 AI 产业将有自主算力底座,不受制于出口管制。2026 年 3 月 30 日 - 4 月 5 日,中国 AI 模型周调用量突破 12.96 万亿 Token,是同期美国的 4.3 倍,国产化市场前景大。

向资本重新伸出的手

追求国产架构性价比使 DeepSeek 有资金压力。该公司长期靠创始人梁文锋和量化基金幻方量化支持,梁文锋持股 84.29%,有近 100% 表决权。2023 - 2024 年其他公司融资时,DeepSeek 潜心研发,2025 年 R1 出世,当年梁文锋拒绝腾讯和阿里巴巴合作。

但 2026 年 4 月,DeepSeek 启动首轮外部融资,募资至少 3 亿美元,目标估值超 200 亿美元,传闻飙至 300 亿美元以上。AI 烧钱也值钱,OpenAI 2025 年亏损 80 亿美元,2026 年预计亏损 250 亿美元,2026 年 3 月完成 1220 亿美元融资,投后估值 8520 亿美元;Anthropic 2026 年 2 月完成 300 亿美元 G 轮融资,投后估值 3800 亿美元,年化收入从 2025 年底的 90 亿美元涨至 2026 年 4 月的 300 亿美元,二级市场隐含估值超 1 万亿美元。

除算力采购,人才竞争也烧钱。脉脉高聘报告显示,2026 年 1 - 2 月,AI 岗位数量同比增长约 12 倍,岗位占比升至 26.23%,平均月薪超 6 万元。字节跳动 Seed 团队近 70 名技术人才离职,字节为抵御人才流失发放专项期权,提高待遇,内部活水流动到 Seed 部门成新风向,面试流程更复杂。字节 2025 年净利润同比下滑超 70%,抖音副总裁李亮澄清是会计因素导致。

AI 公司人才流动给 DeepSeek 带来压力,2025 年 11 月罗福莉加入小米 MiMo 团队,2025 年底 2026 年初王炳宣加入腾讯混元团队,2026 年 1 月阮翀加入元戎启行,2026 年 4 月郭达雅加入字节 Seed 团队。有说法称梁文锋融资是为员工期权定价留人才。

DeepSeek 在 C 端推行 token 平权,靠 B 端 API 调用商业化,更需引入资本市场力量。

被支持,也被期待

DeepSeek 作为国产大模型受厚望,2025 年 1 月 R1 出世,以低训练成本达 OpenAI 顶尖模型性能,引发全球科技股震荡。R1 上线后,国家超算互联网平台、多家国产芯片厂商和云巨头提供支持。

人们期待 DeepSeek 在算力自主上探索,V4 适配华为昇腾是回应。V4 发布前,有人期望新模型多模态进步,但 V4 仅支持文字输入,暂不支持原生多模态功能,而 Gemini 3.1 Pro 已实现“全模态”,GPT - 5.4 支持全链路,国内主要大模型基本支持文本 + 图片输入。

DeepSeek 的融资与转向反映中国 AI 创业公司困境,技术迭代快、资本开支大,“中小厂”研发窗口收窄,智谱和 MiniMax 赴港上市,月之暗面融资。引入外部融资是否掣肘决策、芯片国产化是否导致中美技术差距拉大是未知数。但 DeepSeek 开源策略和低成本训练方法论有品牌认知,底层技术创新证明研发能力。若 V4 在国产芯片上性能有竞争力,中国 AI 公司能在制裁环境下用少钱、自主供应链做出一流产品。

http://www.jsqmd.com/news/700140/

相关文章:

  • Llama-3.2V-11B-cot详细步骤:模型路径配置与自动加载机制解析
  • WinRAR CVE-2023-38831漏洞深度剖析:不只是双击压缩包那么简单
  • JVM调优实战:从垃圾回收到内存模型,一次性搞定JVM核心知识点
  • 51单片机实战:从直流电机调速到步进电机精确定位
  • MogFace人脸检测工具效果实测:cv_resnet101_face-detection_cvpr22papermogface极端姿态识别能力
  • 网站建设不只是「做个页面」:潍坊企业技术选型的五个关键判断
  • UIEffect终极指南:3分钟为Unity UI添加专业级视觉效果
  • 从0x000000D1蓝屏到系统稳定:深入剖析iaStorA.sys故障的根源与修复路径
  • D2RML终极指南:如何5分钟实现暗黑破坏神2重制版高效多开
  • 惊群效应(Thundering Herd)深度解析
  • TiDB 实战项目:从需求分析到生产级代码完整记录
  • 水族用品推荐 - 观域传媒
  • 暗黑破坏神2存档编辑革命:告别繁琐,拥抱网页端自由定制
  • 前荣耀CEO赵明首秀,千里科技欲三年内跻身智驾行业头部,目标能否达成?
  • Go语言中间代理库MPS:构建灵活HTTP/HTTPS流量控制中间件
  • GetQzonehistory:三步搞定QQ空间说说完整备份,永久珍藏你的数字记忆
  • 重庆江津云澜栖避暑房二手房折价率回归分析:哪些特征影响保值?
  • 2026 年最新:Anthropic 注册政策变化及应对策略
  • 有封面图的
  • 【YOLOv5改进实战】Neck特征融合新思路:CAM模块在PANet不同层级的注入与性能调优
  • C++ 类型转换深度解析:static_cast、dynamic_cast、const_cast、reinterpret_cast
  • ​.NET 实战:Redis 缓存穿透、击穿与雪崩的原理剖析与解决方案
  • 企业级AI操作系统Casibase:统一管理多模型与智能体编排的RAG平台
  • 网络安全学习路线全图谱:从零基础到高阶专家
  • Python 哨兵值模式(Sentinel Value Pattern)深度解析
  • SecGPT-14B精彩案例分享:真实CTF题目自动解析+EXP构造逻辑生成过程
  • 手撕CUDA 13新特性:如何用Cooperative Groups重构AllReduce——分布式训练通信开销直降41%(含NCCL 2.18源码补丁)
  • Day08-MySQL
  • 10个实用技巧:用AnimateDiff插件轻松制作AI动画视频
  • AI Coding 选哪一家?2026 全面对比指南