当前位置: 首页 > news >正文

Kimi融资超376亿商业化成熟,DeepSeek拟募资500亿估值超515亿美元,谁能笑到最后?

Kimi是融资最多的创业派,DeepSeek是估值最高的技术派,前者拼商业,后者拼“国运”。

最近,被并称为“中国AI开源双子星”的Kimi(月之暗面)和DeepSeek(深度求索)频繁刷屏。先是新模型接连发布,Kimi刚推出K2.6,DeepSeek就放出了V4;接着是资本市场风向巨变。2天前,Kimi宣布完成约20亿美元融资,由美团龙珠领投,投后估值约200亿美元。历经三轮融资与近一年的商业化积累,Kimi的ARR已突破2亿美元,付费订阅与API收入加速增长。几乎同一时间,此前长期拒绝融资、几乎完全依靠幻方量化“自我供血”的DeepSeek正式开放外部融资。最新消息显示,DeepSeek拟募资500亿元,创始人梁文锋计划优先出资200亿元,占本轮40%。投后估值从最初的百亿美元级别,一路推高至超515亿美元,约为Kimi的2.5倍。一旦落地,这不仅会成为中国AI史上最大单笔融资纪录,更将创下中国所有创业公司中首轮融资的估值天花板。

同为开源模型,同样挑战万亿参数,为何在资本牌桌上,两家公司的筹码相差如此之多?

两种钱的味道

如果只看融资金额,Kimi是目前国内大模型创业公司里融资最成功的一家。从2023年成立至今,月之暗面累计融资已超过376亿元。这个数字看似耀眼,但拆开来看,Kimi拿到的不只是“钱”,而是一整套与资本、云厂商和互联网巨头深度绑定的资源体系。2024年初,阿里向Kimi投入约8亿美元,成为单一最大股东,持股约36%。这笔融资是Kimi真正的转折点。不过这8亿美元并非全是现金,其中相当一部分是以阿里云算力信用额度的形式完成,实际出资金额不到6亿美元。换言之,Kimi拿到的“弹药”本质上是提前预支的云资源,消费多少,额度就减少多少,而阿里则把这部分计入云业务收入。云厂商与大模型创业公司之间“你中有我,我中有你”,在这里有了另一层含义。后来,腾讯超额认购了一轮融资,于是,两个互相竞争的互联网巨头同时成为Kimi的重要股东。最新这一轮20亿美元融资里,美团龙珠、中国移动、CPE源峰等进入了投资方名单,阿里与腾讯在前几轮也有持续超额认购。据传腾讯同时也在接触DeepSeek,它既投Kimi,也接触DeepSeek。对腾讯来说,这更像是一种“AI时代的保险策略”;但对于Kimi来说,腾讯一边制衡阿里,一边又可能成为竞争对手背后的资本力量。这就是市场化AI创业公司的现实,钱越来越多,但每一笔钱背后都带着自己的诉求。

DeepSeek背后是幻方量化。长期以来,DeepSeek的研发几乎完全由幻方自有资金支撑,没有外部VC,没有融资时间表,也没有云厂商绑定。所以过去几年,梁文锋可以不着急。别人卷商业化,他卷训练效率;别人抢入口,他继续做开源。现在,DeepSeek准备第一次引入外部资本。但即便如此,梁文锋依旧牢牢锁定控制权,计划自己出资200亿元,占这一轮融资的40%。据传国家集成电路产业投资基金洽谈领投,国家队的出现,可能会改变DeepSeek的属性。这两种钱,本质上对应着两种公司形态,如果说Kimi是最典型的市场化AI创业公司,Deepseek则更像一种“国家战略能力”的延伸。

更有趣的是,当外界还在比较两家公司谁的模型能力更强时,他们的技术底层其实早已悄悄“融合”。DeepSeek V4的技术报告里,用了Kimi提出的Muon优化器;Kimi K2的底层架构里,又用了DeepSeek提出的MLA。两家公司的论文互相引用,技术栈彼此嵌套,像两个互相咬合的齿轮,一边竞争,一边给对方提供动力。OpenAI甚至在一篇论文中点名指出:Kimi和DeepSeek是“最早复现OpenAI - o1 Long - CoT”的两家公司。不过现在,他们已不再是OpenAI的“追赶者”。K2.6带来了SWE - Bench Pro 58.6%的Agent集群并行编程能力;V4则把百万上下文做成了全服务标配,输出长度拉到384K tokens。此外,两家公司还在同时推进国产芯片适配。DeepSeek V4下半年将支持华为昇腾950,寒武纪已经完成Day 0适配;Kimi K2.6也开始支持国产芯片混合推理。Agent能力、编程天花板、百万上下文、国产芯片适配、开源生态……几条路线几乎同步撞车。从“学会思考”到“学会干活”,从“改Transformer”到“改算力底座”,这场看似彼此竞争的技术演进,展现的是中国AI开始逐渐摆脱单纯对标OpenAI、降低对英伟达依赖,并在开源生态里走出属于自己的路。

会赚钱,为什么估值更低?

Kimi已经具备了一家“成熟AI创业公司”的雏形。它有C端产品,有付费用户,也有越来越清晰的Agent商业化路径。无论是会员订阅,还是API收入,都已经开始进入加速增长阶段。Kimi的ARR,即年化经常性收入已突破2亿美元,这个数字是美团龙珠主动披露出来的。在一级市场里,投资方主动强调ARR,其实是在给估值做背书。毕竟在国内AI创业公司里,真正跑出稳定收入模型的并不多。

DeepSeek的逻辑则完全不同,它的核心策略是先做生态覆盖,再谈商业化。DeepSeek的API定价,长期维持在OpenAI的十分之一左右。它更在意的是模型渗透率、开发者生态和开源影响力,而非短期收入。因此,直到今天,DeepSeek的真实营收依旧没有公开。另一边,它的用户规模却在快速膨胀。目前,DeepSeek月活已经达到1.27亿,是Kimi月活(900万)的14倍。

于是,一个非常微妙的局面出现了:ARR已突破2亿美元、商业化路径更成熟的Kimi,估值约200亿美元;而收入规模尚未公开、仍在强调低价开放的DeepSeek,估值却已冲向515亿美元,约为Kimi的2.5倍。这背后反映出的,其实是资本市场评价逻辑的变化。今天的AI投资,奖励的不再只是“你现在能赚多少钱”,还有“你未来可能成为什么”。一旦国家资本真正进入,DeepSeek的叙事可能变成“中国AI基础设施”,其对应的估值逻辑自然也不再只是传统商业公司的市盈率。在2026年的AI投资语境里,Kimi的“会赚钱”反而意味着边界更清晰,想象空间有限。

但这一估值悖论不会长期存在。The Information在报道里提到,DeepSeek此轮融资之后,将“加速营收规划与商业化落地”,同时加快模型发布节奏,“向行业主流靠拢”。据悉,DeepSeek 6月推出的V4.1,还会专门增加面向企业用户的工具能力。这意味着,DeepSeek也开始被推着讲商业化故事了。过去,梁文锋可以不急,因为幻方的钱没有外部LP,也没有退出周期。但外部资本一旦进入,时钟就会开始滴答作响。Kimi今天面对的那些问题:收入、增长、商业化效率、资本预期……DeepSeek未来大概率也会面对。某种程度上,Kimi那2亿美元ARR,更像是一张“先行者地图”。

杨植麟与梁文锋的账单

杨植麟和梁文锋都是广东人,一个来自汕头,一个来自湛江。Kimi和DeepSeek是中国首批开源万亿参数模型的玩家,他们在技术信仰上非常相似:都相信Scaling Law,都在挑战万亿参数级别的大模型。DeepSeek更擅长推理模型,Kimi更强调Agent能力。技术路线虽然不同,但底层目标其实高度一致。尤其在更底层的架构创新上,两家公司几乎总是在同一个方向上“撞车”。Kimi发了“注意力残差”论文,DeepSeek做了mHC残差连接;Kimi在线性注意力方向探索Kimi Linear,DeepSeek则在稀疏注意力方向推进DSA。看似路线不同,本质上都在挑战Transformer时代那套“古老基础设施”。

不过在“如何保护技术理想”这件事上,两个人却走了完全不同的路。杨植麟的方法是制度设计:AB股、双层股权结构、技术团队拥有绝对投票权。除此之外,杨植麟还引入了张予彤。她最初以金沙江创投合伙人的身份出现在Kimi的融资谈判里,是最早帮Kimi拿到阿里那笔近10亿美元融资的关键人物。后来因为与金沙江之间的利益争议离开了基金,中间经历了一段公开的舆论风波,再往后,在2025年底,她以“月之暗面总裁”的身份正式公开亮相,全面负责公司战略、融资与商业化。而这些事,恰恰是杨植麟不擅长的,或者说不愿意长期消耗精力的部分。杨植麟是典型的技术创始人。在英伟达GTC 2026的演讲里,他花了大量时间讲Muon、讲训练效率、讲万亿参数规模下的稳定性问题。

梁文锋也是一位技术极客,他掌握控制权的方式更直接:真金白银。首轮外部融资,他自己出资200亿元,占这一轮的40%,不依赖复杂制度设计,也不依赖特殊投票权安排,主打一个“用资本打败资本”。

很难说这两种方式谁更高明。制度设计的好处是杠杆高,用相对少的股权锁住更多的控制力。但制度是人设计的,执行过程里会有摩擦、争议,甚至是意想不到的代价。据暗涌报道,Kimi创立初期,杨植麟从上一家公司循环智能带走了核心团队,但老股东的豁免同意书一直没有完全签完。彼时大模型融资狂热,很多问题都被默认“先上车再说”。后来随着阿里近10亿美元融资落地,争议开始浮出水面。帮Kimi谈下这轮融资的张予彤,当时还是金沙江创投管理合伙人,而她丈夫汪箴同时又是Kimi联合创始人。随后,朱啸虎深夜发朋友圈提到“fiduciary duty(受托责任)是高压线”,后来循环智能老股东也发起仲裁。因此,一个设计精密的AB股结构,并不能完全解决公司创立初期留下的人情关系与程序问题。真金白银的好处是清晰,没有歧义,但前提是你得有那么多钱,而且愿意押进去。梁文锋有幻方在背后,这条路他走得起。

不同选择也映射了两家公司不同的资源禀赋。Kimi从一开始就是市场化创业公司,所以它必须学会与资本长期共处;DeepSeek依靠自有资金熬过了最艰难的阶段,因此可以用更强势的方式处理控制权问题。各有各的活法。在技术上,他们互为彼此的“基础设施”。商业上,他们曾经走在两条不同的轨道上。但随着DeepSeek开始引入外部资本,两条轨道正在慢慢靠近。钱是有重量的,外部资本一旦进来,所有公司最终都要面对同一张账单。Kimi已经先行一步,Deepseek刚刚上路。

http://www.jsqmd.com/news/800076/

相关文章:

  • 2026注塑厂家推荐:电子零配件加工厂+机加工镭雕厂家+钣金加工厂推荐 - 栗子测评
  • 手把手复刻1889年Kallitype专利工艺:用Midjourney生成符合John Spence历史级密度曲线的负片(含Log-C转Kallitype Density Table)
  • 构建智能代码筛选框架:从AST解析到规则引擎的工程实践
  • Windows实时语音转文字终极指南:TMSpeech让离线字幕生成如此简单
  • Python与WebAssembly:在浏览器中运行高性能Python代码实战指南
  • 如何高效进行后端开发中的数据库设计与优化
  • 51单片机项目实战:用LCD12864自制一个温湿度计(带中文界面和自定义图标)
  • Graphpack与Express集成:如何添加自定义中间件和路由
  • ScrollNice:开源鼠标滚轮替代方案,悬停滚动与高度自定义体验
  • 鼎捷数智冲刺港股:第一季营收4.4亿,扣非后净亏2112万 富士康是大股东
  • 保姆级教程:用C++在洛谷B2027、OpenJudge上正确计算球的体积(附PI定义与格式化输出详解)
  • 别再只会用df -h了!用ncdu可视化揪出Linux服务器磁盘爆满的元凶(附Docker日志清理脚本)
  • 终极Obsidian笔记模板指南:20+专业模板快速构建个人知识库
  • Tera数据库:从入门到精通,打造互联网级分布式存储系统
  • FPGA合成工具优化策略与硬件设计实践
  • 【嵌入式Linux应用开发基础】进程间通信:套接字
  • BNO055与JY901传感器选型实战:从硬件连接到精度实测
  • AI编程脚手架:用Claude代码模板提升开发效率与规范
  • 贾跃亭出任FF全球CEO,Jerry任董事长,升级为物理AI生态系统公司
  • 第二章-08-创建目录命令(mkdir)
  • 别再只存model.state_dict()了!深入理解PyTorch的state_dict,优化你的模型保存策略
  • OSINT自动化框架openeir:模块化设计与情报收集流水线构建
  • 杭州品深电源科技有限公司2026通信电源厂家精选:电源定制厂家/电源模块厂家优选杭州品深电源科技 - 栗子测评
  • 【带余除法】信息学奥赛一本通C语言解法(题号1009)
  • 避开BUUCTF《Life on Mars》的思维陷阱:当information_schema查询结果‘不对劲’时,你的排查清单应该有哪些?
  • 从零学会基础算法前缀和差分:数组区间求和离散化基础
  • 跨平台AI模型库ailia-models:400+预训练模型与高性能推理引擎深度解析
  • 路由器4444260419
  • AI智能体工具链故障自救:构建经验驱动的AgentRX恢复系统
  • 老味餐厅自研 APP:从线下到线上的营收翻倍之路