当前位置：首页 > news >正文

DeepSeek寻求3亿美元融资：从隔离到融入，AI竞争下半场的新抉择

news 2026/7/17 22:11:15

DeepSeek开启外部融资

DeepSeek开始接触外部资本。The Information引述四位知情人士报道，DeepSeek正在寻求至少3亿美元的首次外部融资，估值不低于100亿美元。若把时间拨回两年前，这几乎是个不成立的命题。那时，这家公司是中国AI行业里最反常识的存在。

当所有人都在融资、扩张、讲生态、抢入口时，DeepSeek反而刻意收缩，不对外发声，不频繁发产品，不参与大厂叙事，甚至对资本保持距离。很多投资人尝试接近，得到的反馈几乎一致：没有融资计划。在高度资本驱动的行业里，这种姿态反工业逻辑。但也正因如此，DeepSeek一度被视为异类样本，一个试图在AI时代验证“少资源路径”的团队。

这次融资信号里，真正重要的不是金额和估值，而是它打破了持续两年的策略前提：DeepSeek不再试图把自己隔离在体系之外。

DeepSeek的防火墙

梁文锋对外部资本的排斥有很深根源。2022年前后，量化行业被政策持续打压，幻方管理规模从巅峰时期的千亿缩减大半。梁文锋手里攥着大量富余的GPU集群和现金，一度想通过投资入股或云厂商合作的方式把算力用出去。

他专门招了两个人做战投，看了一圈科技项目，低空经济、智能硬件、SaaS，最终一个也没投。当时DeepSeek内部判断，外面能做的事，自己也做得了。

2023年7月，DeepSeek正式成立。梁文锋从第一天就给这家公司划了条线，不接受外部融资，不稀释股权，不被任何人的商业化时间表绑架。他想造的东西，更像纯粹的研究机构，追AGI、做开源、让技术本身说话。

他的底气十足。早在2019年，他就花2亿元自研了深度学习训练平台萤火一号。两年后又砸10亿元建萤火二号，大批采入英伟达A100，把幻方做成了国内屈指可数的万卡集群公司。疫情期间芯片供应最紧张时，幻方已提前囤好货。2025年，幻方全年收益率56.6%，营收超50亿人民币。梁文锋的钱袋子，比绝大多数AI创业公司的投资人都丰盛。

有钱、有卡、有人，VC的钱反而是负担，带着对赌、估值压力和变现追问。他说得很直接：VC都是帮LP管钱，都得赚钱，所以就谈不到一块去。

这条路在2025年1月到达巅峰。R1发布，训练成本约560万美元，性能逼近OpenAI的顶级系统。“用十分之一的钱做出同级模型”，让行业意识到顶级模型能力并非只能通过极端的资源堆叠获得。那一刻，DeepSeek的意义被迅速放大，它提供的不只是模型，更是一种可能性，在资源不占优的情况下，仍可进入核心竞争区。防火墙不仅立住了，还成了故事的一部分。

但故事需要不断续写。

裂缝出现了

裂缝并非突然出现，从R1发布后就开始生长，只是当时信号分散。最先松动的是人。

顶级模型团队有共性，核心成员市场价值极高，项目进入空档期，这些人就会成为市场目标。最早被注意到的是罗福莉，V3架构的关键开发者，2025年底转投小米接手MiMo大模型团队。差不多同一时期，第一代大语言模型核心作者王炳宣去了腾讯，多模态方向的核心研究员阮翀加入元戎启行做首席科学家，OCR系列核心作者魏浩然也在今年春节前后离开。

然后是郭达雅。1994年生，中山大学博士，在DeepSeek只待了两年，却全程参与了V3、R1、Coder、Math、Prover等几乎所有标志性模型的研发。他提出的GRPO算法是R1的核心技术底座，论文总被引超过37000次，在同龄的中国AI研究者里几乎找不到对手。前两天，郭达雅加入字节跳动，方向是智能体。

五个核心研发骨干，在不到一年的时间里相继出走。这些流动的意义超出人走本身，在模型研发里，经验高度路径依赖，核心成员离开会直接影响下一轮迭代的效率和节奏。

他们为什么走？猎头圈流传的数字是，大厂给DeepSeek核心技术人员的开价，普遍是原薪资的两到三倍。字节Seed团队从2025年9月起推出专项期权津贴，按职级每月发放9万到13.5万元不等的期权，价格低于内部回购价，相当于直接打折。

梁文锋的管理哲学在中国科技行业里几乎是个异类：不加班、不打卡、不设KPI。员工下午六七点走人，早上不用签到。他认为一个人每天高质量工作的时间很难超过六到八小时。这种文化在DeepSeek还是小团队时运转得很好，聪明的人给够自由度，他们自己会往最难的方向冲。但当外面有人拿八位数总包来敲门时，自由就不够用了。

更致命的是期权。DeepSeek从未融资，没有市场化的估值锚点。给核心成员一个股权承诺，他拿到手里没法换算成真金白银。大厂的期权有行权价、内部回购机制、IPO预期。外界只知道DeepSeek很值钱，但到底值多少，没人能说清，员工更不知道。

郭达雅的离开可能比薪资的账面差距更值得琢磨。他去字节做的是智能体，DeepSeek至今没有任何一个Agent产品，R1发布时甚至不支持function call（函数调用）。想做Agent，但所在的公司不做这个方向，这种错位，给再多钱也填不上。

与人一起松动的，还有产品节奏。下一代旗舰V4原本定在春节前后发布，推到2月，再推到3月，目前的口径是4月下旬。从公开信息来看，延期背后至少有三层原因交织。

最直接的一层是技术路线本身发生了质变。V4要做的已不再是刷benchmark的基础模型，万亿参数MoE架构、原生多模态、百万token上下文、全新的Engram条件记忆机制，这是系统级工程，训练验证的复杂度陡然上了一个台阶。

更深一层的压力来自身份包袱。DeepSeek立身靠的是十分之一成本做到顶级这个故事。V4如果只是性能微增却推高了推理成本，支撑估值和声誉的故事就会出现裂痕。某种程度上，一个不够惊艳的V4，反而不如不发。

还有一层很少被充分讨论，即国产芯片的深度适配。多方信源在4月初披露，V4将全面运行在华为昇腾950PR芯片上，有望成为首个完全跑在国产算力上的旗舰大模型。战略价值极高，但这本身就是独立的巨型工程，直接吃掉了大量研发带宽。

到2026年4月，DeepSeek已有15个月没有大版本更新。而这期间，OpenAI迭代四五轮，Anthropic连推Claude 4.5/4.6/4.7，国内同行如智谱、月之暗面、字节也在应用层狂飙突进。所有人都在加速，只有DeepSeek静悄悄。

和很多团队不同，DeepSeek在R1之后没有迅速扩张，没有大规模商业化推进，没有密集的版本更新。当时不少人把这种节奏理解为定力。但从今天回看，它更接近主动选择，尽可能延长“实验室状态”的时间。保持克制本质上是在控制节奏，但当外部环境整体加速时，节奏就不再完全由自己决定了。

竞争换了一套逻辑

如果把DeepSeek当前的处境单独看，很容易归因为公司内部问题。但更关键的变量来自外部，过去15个月，整个行业的竞争维度发生了巨大迁移。

更早的时候，大模型竞争的核心在架构、训练方法和工程优化上。2026年之后，新的东西开始占据主导，算力池的规模、人才的密度、应用层的反馈速度。三者共同决定了迭代能跑多快。

海外头部公司的收入结构已经说明了方向。Anthropic年化收入从90亿美元翻到300亿美元，用了四个月，增量几乎全部来自Claude Code这一款编程智能体。Cursor一个代码编辑器，估值600亿美元。GitHub Copilot覆盖了2000万开发者。钱在流向能直接产出代码、产出工具、产出应用的产品。

国内同行也在快速补位，字节、阿里、腾讯各自铺了Coding和Agent产品线，智谱和月之暗面的API在年初的小龙虾热潮中被打爆，恰恰因为它们在Coding方向上的押注。

很显然，单点的模型能力仍然重要，但不再是唯一的决定因素。资源、组织、系统能力，开始成为关键变量。中国几家头部公司过去一年的动作路径不同，方向一致，把模型能力嵌入到更大的系统里。

DeepSeek有全球开源社区最高的人气，GitHub上17万颗星，2.6万个企业账户，每月57亿次API调用。但它没有自己的IDE，没有Coding工具，没有Agent产品，没有终端用户直接为之付费的垂直应用。

梁文锋一直坚持模型是一切的根基。他最近署名的论文方向，条件记忆机制、超连接优化Transformer，说明DeepSeek的注意力仍然在解决底层问题。这种执着在R1时代被验证过，用最少的钱和人，把基础能力做到极致，剩下的交给开源生态。

但当竞争从基础模型能力扩展到能力 + 产品 + 生态同时比拼时，只有发动机没有整车，再强也跑不起来。

3月29日晚间，DeepSeek遭遇了上线以来持续时间最长的一次服务中断，超过7小时，波及数亿用户。官方没有解释原因。中断期间竞品流量明显跳升，部分企业客户开始考虑多平台冗余策略。一次宕机不会杀死一家公司，但它把一个事实推到了台面上。当用户从百万级涨到亿级，基础设施的投入就不是效率优化能兜住的了。幻方的利润撑得住，但撑得不从容。

3亿美元买什么？

3亿美元对100亿美元的估值来说，稀释比例不到3%。对比Anthropic和OpenAI这样的巨头，这个数字甚至显得极为克制。梁文锋真正想买的东西，可能不在资产负债表上。

首先，期权终于有了锚点。100亿美元的定价一旦确认，核心团队手里的股权就成了真金白银。对一个正在被大厂逐个挖角的团队来说，这个信号比任何加薪方案都管用，现阶段止住人才流失至关重要。

其次，这是V4的保险金。华为昇腾的全量适配本身就在烧资源，与此同时媒体报道称DeepSeek也在用英伟达最新一代Blackwell芯片训练下一代模型，而这款芯片受出口管制影响，获取节奏存在变数。两条硬件路线并行，资金消耗成倍放大。

最微妙的一层是，这是一张进入下半场的入场券。AI竞争已进入模型、产品、生态、资本四轮驱动的阶段。你可以拥有全球最好的发动机，但如果没有资本背书和产品生态，你最终只是产业链里的一名高级供应商，看别人拿你的模型赚钱。

从V4的研发方向来看，梁文锋大概已经意识到了这一点。多方信源显示，V4的规划明确包含了AI搜索、长期记忆和代码能力的大幅跃升，这些都是Agent时代的底层能力。DeepSeek在补课。融资，是为了让这门课来得及上完。

外界很容易把这次转向理解为妥协。但换个角度看，它更接近一种从实验状态向工业状态的进化。AI行业的成本曲线已陡然上扬，人才通胀超出了所有人的预期。依靠个人风格和单一利润源去扛一家超级独角兽，变得越来越不现实。梁文锋过去的选择有它的逻辑，控制规模、避免过早商业化、保持研发的纯度。这样的选择，在特定阶段极具爆发力，但行业节奏最终会对所有人产生约束。3亿美元，是梁文锋第一次公开承认这件事。

查看全文

http://www.jsqmd.com/news/662013/