当前位置：首页 > news >正文

DeepSeek的484天：从“557万训练成本“到腾讯阿里争相投资！

news 2026/6/16 23:42:00

2026年4月，中国人工智能领域迎来了一场引人注目的资本盛宴。作为2024年底横空出世的AI新星，DeepSeek仅用484天时间，就从一家低调的模型实验室，变成了腾讯、阿里争相入局的焦点企业。

事件源于2026年4月24日DeepSeek-V4的正式发布。这款新模型搭载1.6万亿总参数、49B激活参数的MoE架构，支持百万token上下文，更引人注目的是——它实现了与华为昇腾950PR芯片的"Day Zero"原生适配。这意味着DeepSeek不再依赖英伟达CUDA生态，标志着中国AI公司在底层算力自主化方面迈出了关键一步。

回溯484天前，2024年12月26日，DeepSeek-V3横空出世。这款模型仅用约557万美元的训练成本，就实现了与全球头部模型比肩的性能，迅速打破"算力越贵，模型越强"的硅谷叙事。同年1月，DeepSeek-R1在美国App Store免费榜登顶，引发英伟达单日市值蒸发约5930亿美元的资本震荡。

然而，低成本神话背后，是现实世界的步步紧逼。2026年初，多名核心技术人员陆续离职：郭达雅加盟字节跳动，罗福莉前往小米，王炳宣加入腾讯。大厂开出的现金薪酬和成熟期权体系，让坚持技术理想主义的DeepSeek面临人才流失压力。

与此同时，商业化的难题浮出水面。2026年4月，路透社报道腾讯、阿里正参与DeepSeek融资谈判，估值从100亿美元被推高至200亿美元以上。腾讯计划收购最多20%股份，虽最终被拒，但足以说明DeepSeek的战略价值已获巨头认可。

"DeepSeek不是缺钱，而是要从'研究组织'转型为'必须向各方解释的基础设施公司'。"一位行业分析师表示。V4的发布，标志着DeepSeek正式进入"换芯手术"阶段——从英伟达H800转向华为昇腾，这不仅是技术选择，更是对供应链安全的战略考量。

484天后，DeepSeek已不再是单纯的技术理想主义者。它是一个被全球开发者使用的开源底座，被腾讯阿里争抢的资本标的，被美国白宫盯上的地缘政治符号。它证明了AI可以廉价，却没证明一家AI公司可以永远廉价地活着。

正如创始人梁文锋所说："DeepSeek不是为了短期盈利，而是为了推动技术边界。"484天过去了，技术边界确实被推动了。只是推动它继续向前的，已不只是技术本身。

查看全文

http://www.jsqmd.com/news/711965/