从珠海少年到Nature封面:DeepSeek天才郭达雅的AGI征途
从珠海少年到Nature封面:DeepSeek天才郭达雅的AGI征途
他博士入学3天完成毕业要求,连续三年横扫腾讯算法大赛,提出GRPO方法让大模型学会“思考”,如今却悄然离场——这位90后技术天才的传奇,远未落幕
01 引子:一封没有官宣的告别
2026年3月,AI圈传出一则并未官宣的消息:DeepSeek核心成员郭达雅,可能已经离开了这家让他声名鹊起的公司。
没有告别信,没有离职声明,只有他导师印鉴教授的一句寄语在圈内流传:“希望他成为中山大学的雷军。”
这句话的分量,懂的人自然懂。
雷军——武汉大学的骄傲,中国互联网的标志性人物。印鉴教授把这样的期待放在郭达雅身上,意味着什么?
意味着这个从珠海走出的年轻人,在他导师眼中,远不止是一个优秀的研究员。
02 少年时代:从“不突出”到“开挂”
郭达雅,广东珠海人,中学就读于珠海一中。和很多天才故事的“神童”开局不同,他曾在采访中坦诚:初中时成绩并不突出。
转折发生在高中。他意识到一件事:被动学习只能让你不掉队,自主学习才能让你飞。
高考结束后的那个暑假,当大多数同学在狂欢时,郭达雅做了一件在当时看来“很傻”的事——他自学完了大学一年级的所有基础课程。
这个决定在当时看起来只是“勤奋”,但回头看,这是他整个学术生涯的“时间套利”:
- 别人大一还在适应高数,他已经开始接触专业核心课
- 别人大二开始做项目,他已经有余力准备竞赛
- 别人大四为毕设焦头烂额,他已经入选了中山大学-微软亚洲研究院联合培养项目
一步快,步步快。
03 中大岁月:入学3天就完成博士毕业要求
2014年,郭达雅进入中山大学计算机专业。本科四年,他展现出了惊人的学术嗅觉和执行力。
在微软亚洲研究院联合培养期间,他师从印鉴教授和周明博士——两位都是NLP领域的重量级学者。周明博士曾任MSRA副院长,是亚洲NLP领域的领军人物之一。
进入博士阶段后,郭达雅创造了一个让所有博士生“破防”的纪录:
入学第三天,他就完成了中山大学博士毕业的论文发表要求。
这不是夸张。中大博士毕业通常需要发表若干篇高水平论文,而郭达雅在本科期间积累的成果已经足够满足这一要求。
这意味着什么?意味着从博士生涯的第一天起,他就不再被毕业压力所困,可以纯粹地做自己感兴趣的研究。
这种自由,对于顶级研究者来说,价值连城。
04 竞赛收割机:还没毕业就赢走百万奖金
学术之外,郭达雅还有一个身份:数据挖掘竞赛的“冠军收割机”。
2019-2021年,他连续三年在腾讯广告算法大赛中夺冠。这是国内数据挖掘领域含金量最高的赛事之一,每年吸引数千支队伍参赛。
他还斩获了ATEC科技精英赛、微信大数据挑战赛等多项顶级赛事的冠军。圈内人开玩笑说:“郭达雅还没博士毕业,就已经赢走了上百万的奖金。”
更令人印象深刻的是他在程序员真人秀《燃烧吧!天才程序员》中的表现。这是一场60小时的极限编程挑战,参赛者需要在高压环境下完成复杂的AI任务。郭达雅被评定为仅有的两名SSS级“巨佬”选手之一,向公众展示了顶级程序员在极限状态下的编码实力。
05 DeepSeek时代:GRPO与R1的诞生
2023年博士毕业后,郭达雅面临选择。顶级大厂的offer摆了一桌,但他最终选择了一家当时还不太为人知的公司——DeepSeek。
为什么?
他的回答很简单:“师姐告诉我,这家公司真的想做AGI,而且有足够的资源和支持。”
加入DeepSeek后,郭达雅几乎参与了所有关键模型的研发:
DeepSeek-Coder & Math(2024年初)
作为核心贡献者,他参与开发了当时开源SOTA的代码模型。在这个过程中,他提出了GRPO(Group Relative Policy Optimization)——一种全新的强化学习方法。
GRPO的核心思想是:让模型在多次尝试中自我比较、自我改进,而不依赖人类标注数据。这个想法在当时看来有些激进,但郭达雅坚信这是通向真正智能的关键。
DeepSeek-V2、V3、R1
在V3项目中,郭达雅专注于探索提升模型推理与代码能力的方法。他和团队反复实验,最终将GRPO从理论变成了实践。
结果就是DeepSeek-R1——一个不依赖人工标注、仅通过纯强化学习就能激发大模型推理能力的模型。
R1的发布震惊了AI圈。它证明了:模型可以自己学会“思考”,而不需要人类手把手教它每一步该怎么走。
这一成果最终登上了Nature封面——这是中国AI研究的高光时刻,也是郭达雅个人学术生涯的巅峰。
06 技术哲学:少就是多
在DeepSeek期间,郭达雅形成了自己独特的技术哲学。他在内部讨论中常说:
“数据不是越多越好,关键是你怎么让模型从数据中学会举一反三。”
GRPO的诞生正是这一哲学的体现。传统方法需要大量人工标注的“思维链”数据来训练模型的推理能力,而GRPO让模型在自我博弈中涌现出推理能力。
这种方法不仅大幅降低了数据标注成本,更重要的是——它可能更接近人类智能的本质。人类并不是通过被灌输无数“解题步骤”来学会推理的,而是在不断尝试和错误中,逐渐内化了推理的规律。
07 告别与未来:成为“中山大学的雷军”
2026年3月,郭达雅离职的消息开始在圈内流传。
虽然DeepSeek官方和郭达雅本人都未对此公开回应,但多方信息源证实了这一变动。他的导师印鉴教授的寄语“希望他成为中山大学的雷军”,更像是一种临别赠言。
关于他的下一站,传言很多。有说他要创业的,有说他加入大厂的,甚至有传言说他入职百度——不过后者已被多方核实为误传:确实有DeepSeek核心人才加入百度,但并非郭达雅本人。
无论去向如何,有一点是确定的:这位90后技术天才的故事,远未结束。
08 结语:什么成就了郭达雅?
回看郭达雅的轨迹,有几个关键的“非对称优势”值得深思:
1. 时间套利意识
高考后的自学、本科期间的科研积累、博士入学前的成果准备——他始终在用“提前量”换取未来的自由度。
2. 赛道选择眼光
从MSRA到DeepSeek,他总能在正确的时点进入正确的平台。2023年加入DeepSeek时,这家公司还未出圈,但他看到了别人看不到的愿景。
3. 技术判断力
GRPO的提出不是偶然。在大家都在卷数据规模、模型参数的时候,他选择了一条更本质的路径——让模型学会自主学习。
4. 纯粹的热爱
从竞赛到科研,从综艺到工业界,郭达雅身上始终有一种“玩”的心态。他不是被KPI驱动,而是被好奇心驱动。
郭达雅的故事,是一个关于“快”的故事——学得快、出成果快、成长快。
但真正的启示或许恰恰相反:所有看起来的“快”,都是长期主义结出的果。高考后的那个暑假、博士入学前的那些成果、GRPO背后无数次的实验——这些看不见的积累,才是真正的传奇底色。
无论他下一步走向哪里,AGI的征途上,郭达雅已经留下了自己深刻的足迹。
而我们,可以期待他的下一站。
