【DeepSeek】从珠海“非典型学霸”到Nature封面作者:郭达雅破茧成蝶的成长心法与不被定义的选择
《从珠海“非典型学霸”到Nature封面作者:郭达雅破茧成蝶的成长心法与不被定义的选择》
副标题:“拉开人与人差距的,不是起点的高低,而是在每一个迷茫的关口,你选择了主动出击还是随波逐流”
标签:#人生成长 #郭达雅 #DeepSeek #字节跳动 #AI Agent #技术哲学
一个人的学习能力,才是最重要的“技术”。
在DeepSeek的核心离职名单中,郭达雅是最特别的一个。
他不是最年轻的那个,也不是学历最耀眼的那一批。但他是唯一一个论文登上Nature封面、论文被引量超过38000次、被三大厂同时争夺的人。更让人惊叹的是——他从未觉得自己是“天才”。
初中时,郭达雅的成绩甚至并不优秀。从珠海一名成绩平平的中学生,到DeepSeek-R1的核心缔造者,再到字节跳动Seed团队AI Agent方向的掌舵人,郭达雅的成长轨迹,藏着每个普通人最值得借鉴的底层逻辑。
一、中山大学的“自学基因”:起点不高,但加速度惊人
1994年12月,郭达雅出生于广东珠海。初中时期,他的成绩并不突出。真正的转折,始于他逐渐意识到自学的重要性,并培养了强大的自主学习能力。
高考结束后,当大多数同学选择放松时,郭达雅做了一件让很多人“不可思议”的事:他自学完成了大学一年级的基础课程。
这让他一进入中山大学计算机学院,就拥有了超脱同龄人的从容——别人在适应大学节奏时,他已经有余力去参加竞赛、主动学习更多技能和技术。
而他自学的脚步远未停止。大四入选中山大学与微软亚洲研究院(MSRA)联合培养博士生项目后,他师从人工智能学院印鉴教授和MSRA周明博士,主要研究方向为自然语言处理。在MSRA实习期间,他便发表了两篇AI顶会论文(EMNLP、NeurIPS),在博士入学的第三天,就完成了中山大学博士毕业的论文发表要求。
但科研之路并非一帆风顺。郭达雅坦言,在MSRA实习的前半年,他也曾充满迷茫,“没有方向,也没有产出”。幸运的是,在印鉴教授和唐都钰老师的指导下,他最终选择NLP作为主攻方向,并开启了一段堪称“魔鬼式”的积累期:每周阅读多篇相关论文,半年累计阅读百余篇,对领域内的重要理论和成果有了深刻理解,并总结出一套适合自己的科研思路和论文写作方法。
深度成长思考(一):真正的自学,不是在舒适区里随意翻书,而是在迷茫区里进行系统性的“饱和式积累”。
郭达雅并非天赋异禀——他自己也坦承:“我的经历表明,我并非天赋异禀,而是通过持续自主学习,走在了他人之前”。很多人抱怨自己“起点低”,却很少思考:你和同龄人的差距,究竟是在课堂的45分钟里拉开的,还是在别人休息的寒暑假里拉开的?郭达雅用行动告诉我们——真正的超越,从来不是靠天赋,而是靠比别人更早进入“主动学习”的状态。
二、微软亚研院的“饱读期”:从迷茫到聚焦的打磨之路
2018年,郭达雅正式成为中山大学与MSRA联合培养的直博生。在MSRA,他师从段楠博士,后者长期从事自然语言处理与代码生成研究,是该领域较早一批探索者。段楠后来对郭达雅给予了极高的评价:“他是最厉害的,博士入学第一周,就完成了毕业要求;参加腾讯的广告算法大赛,年年他们只能得第二,没有人得第一。”
博士期间,郭达雅的研究聚焦于程序理解与生成领域,提出了基于代码预训练的方法和模型,其博士学位论文《基于预训练的程序理解与生成》于2023年获评中山大学优秀博士学位论文。与此同时,他斩获了多项科技竞赛的冠亚军,包括2019年和2020年蝉联腾讯广告算法大赛冠军(单项比赛奖金高达50万),以及2019年CCF BDCI的亚军。有业内人士调侃,还没毕业的郭达雅,仅靠比赛奖金就已经是“百万富翁”了。
2020年,他从全亚洲36所顶尖研究型大学或机构的106名优秀博士生中脱颖而出,成为当年度仅有的12名“微软学者”奖学金获得者之一。2021年,他入选AI华人新星百强榜单。
如果只用一句话来总结郭达雅的成功,或许就是:在没人看见的地方,他已经读完了上百篇论文、拿了数不清的比赛冠军。这种“先积累、后爆发”的节奏,贯穿了他整个成长阶段。
深度成长思考(二):先有“饱和式输入”,才有“爆发式输出”。
郭达雅在MSRA的半年“阅读沉淀期”,是一段几乎没有外部产出的时间。但他坚持下来了。很多人一辈子都在找捷径,却始终没能像郭达雅那样,用半年的时间“死磕”一个领域的所有论文。正如他自己所说:环境和成果都很重要——但成果的前提,是你在正确的环境中,完成了足够厚实的原始积累。
三、DeepSeek三段式全栈进击:从Coder到R1的硬核长征
2023年7月,博士毕业的郭达雅选择了当时还名不见经传的DeepSeek,而非更知名的互联网大厂。
促使他做出这个选择的理由很纯粹:“一位师姐在DeepSeek工作,她跟我聊了DeepSeek的愿景——追求AGI,推动人类社会的加速发展。这跟我的价值观是相合的”。
此后两年,郭达雅完成了一段教科书级别的技术攻坚马拉松,几乎一个不落地参与了DeepSeek最核心的研发主线:
2024年1月,DeepSeek-Coder:推出覆盖1.3B到33B参数的开源代码模型,在多项基准测试中登顶当时开源代码模型的SOTA。郭达雅是该系列的第一作者。
2024年2月,DeepSeek-Math:在Coder基础上针对数学能力进行继续训练,额外使用120B数学相关token。更关键的是,这篇论文中提出的GRPO新型强化学习方法,后来成为DeepSeek-R1推理能力爆发的关键技术基础。
2024年5月,DeepSeek-Prover:将模型的推理能力延伸到了更硬核的形式化定理证明领域。该模型在Lean 4定理证明基准上实现了46.3%的准确率,远超GPT-4的23.0%。
2024年末-2025年初,DeepSeek-V3与R1:作为核心研究员,他的动态检索增强等方法被成功应用于V3模型的研发。R1的相关论文后来登上Nature杂志封面,其训练成本仅约29.4万美元,震惊全球AI圈。
与一些只挂名的“参与者”不同,郭达雅在DeepSeek的研发中,扮演的是贯穿全线的核心攻坚手角色。从专项模型到基座模型,从强化学习算法到推理范式,他的足迹覆盖了DeepSeek最完整的研发链条。
深度成长思考(三):真正的“核心”,不是参与了项目,而是打通了从0到1的完整链路。
郭达雅在DeepSeek的三年,不是在做“某个模块”,而是在做“整个链条”——从代码智能到数学推理,从强化学习到Agent探索。这种全栈式的深度参与,让他不仅理解了技术的“点”,更掌握了系统的“面”。在一个顶级平台上,最有价值的不是参与了什么,而是你在其中扮演了不可替代的角色,并积累了打通全链路的能力。郭达雅的成长并非孤例——同期DeepSeek涌现的一批年轻核心研究员,如王炳宣、罗福莉、阮翀、魏浩然等人,分别扛起了基座模型、多模态、OCR等核心技术主线,共同构成了这支团队令人瞩目的技术密度。
四、Agent先行者:研发生涯中的超前探索
在郭达雅的研发生涯中,Agent方向并非从他加入字节才开始的“转身”。早在DeepSeek内部,他就已经在Agent相关技术层面进行了大量探索。
他主导的代码智能与推理能力,本身就是Agent落地的核心基础——Agent能否真正“跑起来”,很大程度上依赖于模型的代码生成能力与复杂逻辑推理力,而这恰恰是郭达雅从DeepSeek-Coder、DeepSeek-Math到R1持续深耕的绝对强项。
与此同时,在V2、V3和R1的研发中,他以第一作者的身份主导了一系列与技术演进紧密相关的关键技术,为Agent方向的长期发展打下了坚实的地基。
2026年,Agent成为AI行业公认的核心方向之一。字节跳动在2026年初启动了针对Agent和Coding的组织整合,字节CEO梁汝波在全员会上明确表示:2026年的重中之重是AI模型能力要做到行业前列。从Trae独立拆分SOLO,到扣子平台升级到2.5版本,这些动作指向同一个方向——字节在为Agent时代全面备战。
而郭达雅,恰好成了那个“最懂如何让Agent跑起来的人”。
深度成长思考(四):一个人的不可替代性,来自于他的能力恰好是某个重大战略方向的“技术瓶颈”。
郭达雅的底层能力——代码智能+推理能力,刚好是Agent落地的“卡脖子”环节。他之所以被字节重金争夺,不是因为他“跳槽”本身,而是因为他的技术方向恰好命中了一个行业级的技术瓶颈。能力与趋势的交汇处,才是一个技术人价值最大化的位置。
五、2026年离巢:为Agent梦想,放弃“DeepSeeker”光环
在DeepSeek如日中天的2025年末,郭达雅做了一个让外界议论纷纷的决定:离开DeepSeek。
但很少有人知道其中的细节。据知情人士透露,郭达雅早在2025年10月便已产生离职意向——他的核心关注点是AI Agent方向,而当时该方向在DeepSeek内部优先级相对有限。离职的种子,并非始于薪酬的诱惑,而是源于研究方向能否充分释放自身技术积累的深层考量。
消息传出后,阿里、腾讯、字节三家大厂迅速行动。阿里给出了post-training负责人的职位,管理范围更大,地点和现金待遇也具备吸引力;腾讯和百度也开出了很高的价码。但郭达雅最终选择了字节的Seed团队——核心原因,仍然是研究方向本身。
2026年4月,DeepSeek V4技术报告公开,近300人的作者名单中,10人标注“已离职”。郭达雅的名字后,星号无声地标注了他的身份:DeepSeek-R1核心研究员,GRPO算法与R1模型的重要参与者,已于2026年3月离职,4月加入字节Seed团队,担任Agent方向负责人之一。
关于薪酬的传闻漫天飞舞——“近亿元年薪”“四年总收益数亿元”——但抖音集团副总裁李亮很快公开澄清:“这个报道不实,字节跳动招聘的所有seed团队技术人员的薪资体系都是一样的”。他同时补充了一个意味深长的细节:假如业务发展得很好,不排除技术人员四年后收益会达到数亿元——但这取决于未来的表现,而非当下的现金承诺。
换言之,郭达雅的薪酬结构中,最大的一块并非现金,而是需要自己用技术成果去兑现的期权。
深度成长思考(五):最高级的选择,是你在“不需要离开”的时候,主动选择了离开。
DeepSeek爆火之后,郭达雅完全可以待在舒适区里吃红利——R1的作者身份足以让他坐享行业尊重。但他选择了奔赴一个更有挑战性的方向。真正的理想主义者,不是在一棵树下等到果实烂熟的人,而是永远在寻找下一个未被开垦的领地的人。
六、写在最后:郭达雅的三层成长心法
回顾郭达雅从珠海一中到中山大学,从MSRA到DeepSeek,从Nature封面作者到字节Agent掌舵人的这段旅程,我们可以提炼出三条跨越周期的成长法则:
第一层:建立“提前量”意识——在别人适应环境时,你已经在奔跑。
从高考暑假自学大一课程,到大四前完成博士毕业的论文发表要求,再到MSRA半年的“阅读饱和期”——郭达雅的每一步,都在为自己争取“时间提前量”。普通人等待机会,高手提前储备迎接机会的能力。
第二层:用“全栈深度”构建职业护城河。
郭达雅在DeepSeek参与了从Coder到R1的全部核心主线,不是蜻蜓点水式地参与,而是每个项目都担当核心作者。这种策略让他的能力不是“长板型”的,而是“系统型”的——当一个人拥有了打通全链条的能力,他就从“可被替换的专家”变成了“不可被替代的枢纽”。
第三层:在方向选择上,永远追随“能力的自然延伸”,而非短期的利益最大化。
从选择DeepSeek到离开DeepSeek,郭达雅始终在做一件事:让能力在正确的方向上得到最大程度的释放。“一个顶尖技术人的职业规划,不是看谁给的钱最多,而是看谁能让自己把擅长的事做到极致。”正如他寄语中大学子时所说——时代和技术都在发展,一个人的学习能力才是最重要的“技术”。
