当前位置: 首页 > news >正文

xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

刚刚,xAI再失一名华人大将。

就在今天,预训练负责人庄钧堂官宣了自己已经离职的消息。

此前,庄钧堂已经在xAI工作了两年。

这期间,他主导了从Grok多个版本模型的预训练,同时负责预训练Grok在X和Tesla上的语音模型及xAI企业API模型。

虽然他在官宣前两个月就已离开,但这波刚好赶上xAI不再独立运营后的新一轮离职潮。

仅今天一天,就有多名员工相继宣布离职。

如此高密度的人员离职,让人不禁感叹,xAI到底是怎么了?

谁是庄钧堂?

2024年,庄钧堂加入xAI。

此后两年,Grok多代模型的预训练都由他主导。

Grok在X和Tesla上的语音模型,xAI对外的企业API模型,也都由他牵头预训练。

在此之前,他在OpenAI工作了两年。

这期间,他是GPT-4技术报告的联合作者,还参与了GPT-4o和DALL-E 3的核心开发,提出了GPT4-Turbo 128k算法,并作为第一贡献者搭建了OpenAI的Embedding模型。

这几件事,分别对应着OpenAI在语言模型、多模态、图像生成和向量检索等方向上的关键节点产品。

他的学术背景,和这份工作履历放在一起,有一定的反差。

庄钧堂本科就读于清华大学,但读的专业并非计算机,而是工程物理,还辅修了法律。

他的硕博生涯是在耶鲁度过的,硕士读的是统计学,博士则是生物医学工程。

读博期间,庄郡堂的研究课题是判断自闭症患者的脑连接组中哪些连接异常与自闭症的诊断相关。

在这个课题中,他使用的工具是神经网络。

在博士期间,他提出了AdaBelief优化器,其核心思路是根据模型对当前梯度的置信程度来自适应地调整步长。

如果当前观测到的梯度方向与模型的预期偏差很大,说明此刻的观测不可信,应该迈小步;如果梯度方向与预期接近,说明信号可靠,可以迈大步。

这个设计触及了深度学习训练中一个长期存在的痛点——现有优化器对噪声梯度的处理过于粗糙。

这篇论文在NeurIPS 2020拿到了Spotlight,随后被PyTorch、TensorFlow、Google Flax、DeepMind Optax等主流框架相继收录,成为研究者工具箱里的常备选项。

马斯克留不住人

就在庄钧堂宣布离职的同一天,xAI还有多名员工相继发出了同样的消息。

三天前,马斯克刚刚宣布xAI不再作为独立公司运营,并入SpaceX,统一更名为“SpaceXAI”。这个消息发出后没多久,离职的消息就接连来了。

与此同时,另一批人正在进场——Cursor的员工开始出现在xAI的办公室里,由xAI现任研究负责人Aman Madaan主持联合会议。

Cursor的到来,目的之一就是解决马斯克一直以来“留不住人”的困境。

从2024年中开始,xAI的联创就在陆续离开,SpaceX完成收购后密集爆发,到今年3月底,11位联创全部清零。

Fast Company统计,过去一年内xAI可查证的离职员工已超过80人。

马斯克也在试图解决人事危机,但专门挖来的人也是说走就走。

今年3月,马斯克把Mistral AI和Thinking Machines Lab联创Devendra Chaplot请来,直接向他汇报,但Debendra入职才一个月,便离职了。

马斯克承认,xAI“没有建立在正确的基础上,正在从头重建”。今年4月,他转向外部,与Cursor达成合作,于是便有了Cursor员工进驻xAI办公室的一幕。

Grok正常更新

尽管马斯克在人事问题上屡遭滑铁卢,但xAI的主要产品Grok,也刚刚宣布了一波更新。

新版增加了连接器功能,支持接入邮件、日历、Notion等工具,帮助用户提取邮件、整理日程。

同时马斯克还下场驳斥了“Grok将死”的传闻。

毕竟一边是团队不再独立运行,另一边又刚刚把Colossus集群租给了Anthropic,让人很难不遐想。

但马斯克表示,新的Grok模型正在Colossus 2集群上正常训练中,也算是解开了Colossus出租的疑云。

那就等着看看,马斯克还能交出怎样的模型吧。

参考链接:
[1]https://x.com/archanfel_anoth/status/2052878350868484361
[2]https://x.com/elonmusk/status/2052269744120869106

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

5月20日,我们将在北京金茂万丽酒店举办一年一度的中国AIGC产业峰会。

首波嘉宾阵容已公布昆仑万维方汉智谱吴玮杰EverMind邓亚峰风行在线易正朝百度秒哒朱广翔Fusion Fund张璐香港大学黄超MarsWave冯雷都来了,🔍了解详情

请你和我们一起,不再只是讨论AI的未来,而是现在就用起来。👉 报名参会

一键关注 👇 点亮星标

科技前沿进展每日见

http://www.jsqmd.com/news/791670/

相关文章:

  • Pulse:构建操作系统级AI助手,实现长期驻留与主动工作
  • 不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件
  • 《杭州网站建设选型指南:10家建站公司技术实力与服务特色对比》 - 速递信息
  • 苏州网站建设公司怎么选?2026年10家实力服务商横向评测与推荐 - 速递信息
  • 北京网站建设公司推荐:2026年优选网站开发服务商深度解析 - 速递信息
  • 如何快速完成OFD转PDF:开源工具Ofd2Pdf三步上手教程
  • 跟着 MDN 学 HTML day_35:(深入解析 CharacterData 抽象接口)
  • Docketeer:开源Docker管理平台,替代Docker Desktop的轻量级方案
  • 3分钟快速解决ComfyUI ControlNet Aux插件模型下载失败问题:新手必看指南
  • 2026年4月郑州可靠的定制彩绘施工中心推荐,汽车车窗膜/汽车改色/定制彩绘/汽车车衣/改色膜,定制彩绘施工店找哪家 - 品牌推荐师
  • 快手视频怎么去水印?快手去掉水印在线解析提取方法|2026最新在线工具对比 - 爱上科技热点
  • 用Attention和MoE预报天气,刷新公里级预测SOTA|CVPR‘26 Highlight
  • SpringMVC01:入门案例搭建(含三层架构、MVC 详解与完整代码)
  • 如何彻底移除Windows Defender:3种模式性能优化终极指南
  • AI教材写作必备!低查重AI工具,一键生成20万字教材无压力!
  • 20253916 2025-2026-2 《网络攻防实践》实践8报告
  • 苏州网站建设公司选型指南:10家实力服务商深度评测 - 速递信息
  • ggml 架构总览:一个 107KB 头文件背后的纯 C 张量计算引擎
  • PyWxDump微信数据解析工具:3步快速备份聊天记录的完整指南
  • 鸣潮智能游戏助手:3步搞定自动化战斗,解放双手轻松游戏
  • DamaiHelper:零基础也能掌握的智能抢票终极解决方案
  • 从Nginx到APISIX:一个后端开发者的微服务网关迁移实战(含Docker部署避坑)
  • 无锡网站建设公司选型指南:10家实力服务商优势对比(含GEO与选型站) - 速递信息
  • 如何三分钟永久解锁科学文库加密PDF?ScienceDecrypting工具使用全攻略
  • PlanAndSolveAgent
  • 高效解决OFD文件兼容性问题:Ofd2Pdf免费开源转换工具完全指南
  • SITS2026千人会场无线漫游卡顿真相(2026年最新802.11ax+Wi-Fi 7协同调度实测报告)
  • 2026年无锡网站建设公司选型指南:10家优秀网站制作服务商横向对比 - 速递信息
  • 2026年降AI工具知网专项实测:五款主流工具知网AIGC检测通过率完整横评分析报告
  • 告别/deep/和::v-deep:在Vue项目中更优雅地管理组件样式的几种现代方案