当前位置: 首页 > news >正文

梁文锋立即决定融资74亿。Claude Mythos一发布!!

4月中旬的AI圈被一条融资传闻搅得心神不宁,三天后The Information拿出的爆料把这锅沸水直接掀翻——Claude Mythos,正是逼得梁文锋拍板融资的那根导火索。

Anthropic今年4月发布Claude Mythos第一个预览。它对标的不再是语言模型的“聪明”,而是直接用海量算力和数据堆出的强能力跨阶。梁文锋看完,内部只传出一句话:“不储备弹药根本没法打下去了。” DeepSeek的融资传闻几乎同步传出,时间对得一笔不差。

最终落定的数字是74亿美元。梁文锋自己掏了200亿人民币,约合30亿美元,占到总盘子五分之二。这个一度被投资人反复拒绝的实验室,创始人用个人支票把三年不融资的纪录亲手打破。

融资宣布后的第一个动作指向了人。DeepSeek全员约300人,本周四罕见发了一份公开声明:所有部门招人“至少翻倍”。Harness团队负责人崔添翼今年3月刚从Jane Street跳过来,他的日程已经切换到每天面试模式。这个部门负责把模型转化为自主AI智能体,是梁文锋眼下最着急吃下来的能力。</p>

但真正让DeepSeek在过去一年半里“憋着不发新模型”的,是人手不足之外另一个更重的代价。华为的昇腾芯片。</p>

华为去年才发现DeepSeek在私下用自家芯片做试验,随后两家开始直接合作。梁文锋一直相信华为芯片几年内就能追上英伟达,DeepSeek应该第一个把适配做完。可这话说得轻巧——整套训练和部署系统原本长在英伟达CUDA上,工程师只能一层层重写底层软件,才能在昇腾上把模型跑起来。</p>

代价是一段扎眼的空窗期:15个月,DeepSeek没有发布任何一个新一代模型。同一时期,其他顶级实验室两三个月就更新一轮。去年下半年Anthropic的Claude Code搅动编程工具市场时,DeepSeek根本连出牌的动作都没有。</p>

梁文锋并不掩饰他对这些“短期产品”的态度。路演时他直接告诉投资人,编程工具和聊天机器人一样,都是AI进化途中的临时产物,重注押上去只会让团队偏离AGI。他把AGI定义为机器在理解、推理、学习、规划和适应上全部达到人类水平,这才是他唯一的目标。</p>

“AI不应该被少数人控制。”梁文锋对身边人说这话时,没打算把它当成一句口号。融资完成后DeepSeek做了两件外界看得到的事:把所有模型底层代码继续完全公开,把轻量版价格打到大模型实验室里最低的那一档。

V4模型的表现让这套策略的冲击感变得具体。5月,V4在Vercel AI Gateway上的token用量份额从不到1%一口气冲到17%,一个月内成为平台第三大模型,前面只剩Anthropic和Google。轻量版V4 Flash的价格比Anthropic模型便宜20到50倍。6月,涨势没停。</p>

此刻回头看2023年,梁文锋确实试着找过钱。他跟投资人讲,DeepSeek只做深度研究和科学探索,没有商业化路线图,没有产品时间表。对面的人一个个打了退堂鼓。最后他自己掏钱养了这个实验室,一养就是三年。</p>

现在他成了这家公司最大一笔钱的主人,员工持股计划同步落地,按实际估值分配股份。战略依然没变:继续开源,保持低价,只做AGI。</p>

当梁文锋赌上200亿和全部开源路线,他赌的究竟是“芯片能追上”,还是“这条路最终只能这么走”?

http://www.jsqmd.com/news/1100412/

相关文章:

  • 2026年AI观察:从虚拟走进现实,从追赶到同台
  • 全网精选 20 个高质量 CTF 练习平台,从入门小白到竞赛大神一站式刷题,练完轻松拿捏各类赛事题型
  • 标准物质厂家怎么选?专家详解选购关键要点
  • 如何用Chinese-ERJ模板轻松搞定《经济研究》期刊投稿:经济学者的排版救星
  • Spring Boot Actuator安全防护:Nginx与APISIX字符绕过漏洞深度解析与配置实践
  • 基于深度学习的钢材焊接缺陷检测系统(YOLOv8+YOLO数据集+UI界面+Python项目+模型)
  • draft-v1
  • AWS开源Blocks框架:AI智能体负责写后端代码,Amplify要凉?
  • wechatapi优化:基于AC自动机的海量关键词毫秒级拦截
  • 缓解模型关系幻觉(披露式的信息让模型深化理解)
  • 客服外包公司排名,哪家口碑更靠谱
  • 华硕笔记本终极轻量控制工具:G-Helper完整指南
  • Linux内核开发入门:从C语言到内核模块的实践路径
  • 告别JMeter:基于Prometheus与Grafana的轻量级性能压测平台实战
  • HTML5、CSS3:完整特性详解(全表格精细化整理)
  • 手把手教你用iPhone Pro的激光雷达,5分钟搞定一个物体的3D模型(附Open3D处理代码)
  • ModelFS:如何利用可编程缓存技术加速LLM推理启动?完整解析
  • dbsyncer —— 一款开源的数据同步中间件,提供 MySQL、Oracle、SqlServer、PostgreSQL、Elasticsearch(ES)、Kafka、File、SQL 等同步场景
  • C++实战:从原理到代码实现RSA非对称加密与安全传输
  • 从传统后端到阿里大模型:小白程序员必备的Agent与RAG进阶指南(收藏学习)
  • 阿里云账号:免实名、高权重高配额说明与充值赠金方案
  • 【电赛/毕设高端局】DMA数据全是0?STM32H7/F7 Cache一致性灾难、DWT纳秒测速与 CMSIS-DSP 极限榨汁指南
  • 【机器人】缓冲的不确定性感知沃罗诺伊单元多机器人碰撞规避【含Matlab源码 15672期】
  • 别再折腾了!Win11/Mac双平台保姆级教程:TeXLive 2024 + TeXStudio 一键安装与中文配置
  • Go项目配置安全实战:使用RSA非对称加密保护敏感信息
  • 手把手教你用GGML测试数据验证RK3588 NPU的矩阵乘法API(附避坑指南)
  • Kiran图标主题配置脚本解析:configure脚本的工作原理与自定义选项
  • 别再死记硬背公式了!用虚拟仿真软件5分钟搞懂迈克尔孙干涉仪原理
  • 2026手机抠图软件合集:免费无水印App与轻量工具实操指南
  • 【Springboot毕设全套源码+文档】基于springboot+spark的买菜推荐系统设计与实现(丰富项目+远程调试+讲解+定制)