DeepSeek的484天:从“557万训练成本“到腾讯阿里争相投资!
2026年4月,中国人工智能领域迎来了一场引人注目的资本盛宴。作为2024年底横空出世的AI新星,DeepSeek仅用484天时间,就从一家低调的模型实验室,变成了腾讯、阿里争相入局的焦点企业。
事件源于2026年4月24日DeepSeek-V4的正式发布。这款新模型搭载1.6万亿总参数、49B激活参数的MoE架构,支持百万token上下文,更引人注目的是——它实现了与华为昇腾950PR芯片的"Day Zero"原生适配。这意味着DeepSeek不再依赖英伟达CUDA生态,标志着中国AI公司在底层算力自主化方面迈出了关键一步。
回溯484天前,2024年12月26日,DeepSeek-V3横空出世。这款模型仅用约557万美元的训练成本,就实现了与全球头部模型比肩的性能,迅速打破"算力越贵,模型越强"的硅谷叙事。同年1月,DeepSeek-R1在美国App Store免费榜登顶,引发英伟达单日市值蒸发约5930亿美元的资本震荡。
然而,低成本神话背后,是现实世界的步步紧逼。2026年初,多名核心技术人员陆续离职:郭达雅加盟字节跳动,罗福莉前往小米,王炳宣加入腾讯。大厂开出的现金薪酬和成熟期权体系,让坚持技术理想主义的DeepSeek面临人才流失压力。
与此同时,商业化的难题浮出水面。2026年4月,路透社报道腾讯、阿里正参与DeepSeek融资谈判,估值从100亿美元被推高至200亿美元以上。腾讯计划收购最多20%股份,虽最终被拒,但足以说明DeepSeek的战略价值已获巨头认可。
"DeepSeek不是缺钱,而是要从'研究组织'转型为'必须向各方解释的基础设施公司'。"一位行业分析师表示。V4的发布,标志着DeepSeek正式进入"换芯手术"阶段——从英伟达H800转向华为昇腾,这不仅是技术选择,更是对供应链安全的战略考量。
484天后,DeepSeek已不再是单纯的技术理想主义者。它是一个被全球开发者使用的开源底座,被腾讯阿里争抢的资本标的,被美国白宫盯上的地缘政治符号。它证明了AI可以廉价,却没证明一家AI公司可以永远廉价地活着。
正如创始人梁文锋所说:"DeepSeek不是为了短期盈利,而是为了推动技术边界。"484天过去了,技术边界确实被推动了。只是推动它继续向前的,已不只是技术本身。
