当前位置：首页 > news >正文

从珠海少年到Nature封面：DeepSeek天才郭达雅的AGI征途

news 2026/3/26 19:50:50

从珠海少年到Nature封面：DeepSeek天才郭达雅的AGI征途

他博士入学3天完成毕业要求，连续三年横扫腾讯算法大赛，提出GRPO方法让大模型学会“思考”，如今却悄然离场——这位90后技术天才的传奇，远未落幕

01 引子：一封没有官宣的告别

2026年3月，AI圈传出一则并未官宣的消息：DeepSeek核心成员郭达雅，可能已经离开了这家让他声名鹊起的公司。

没有告别信，没有离职声明，只有他导师印鉴教授的一句寄语在圈内流传：“希望他成为中山大学的雷军。”

这句话的分量，懂的人自然懂。

雷军——武汉大学的骄傲，中国互联网的标志性人物。印鉴教授把这样的期待放在郭达雅身上，意味着什么？

意味着这个从珠海走出的年轻人，在他导师眼中，远不止是一个优秀的研究员。

02 少年时代：从“不突出”到“开挂”

郭达雅，广东珠海人，中学就读于珠海一中。和很多天才故事的“神童”开局不同，他曾在采访中坦诚：初中时成绩并不突出。

转折发生在高中。他意识到一件事：被动学习只能让你不掉队，自主学习才能让你飞。

高考结束后的那个暑假，当大多数同学在狂欢时，郭达雅做了一件在当时看来“很傻”的事——他自学完了大学一年级的所有基础课程。

这个决定在当时看起来只是“勤奋”，但回头看，这是他整个学术生涯的“时间套利”：

别人大一还在适应高数，他已经开始接触专业核心课
别人大二开始做项目，他已经有余力准备竞赛
别人大四为毕设焦头烂额，他已经入选了中山大学-微软亚洲研究院联合培养项目

一步快，步步快。

03 中大岁月：入学3天就完成博士毕业要求

2014年，郭达雅进入中山大学计算机专业。本科四年，他展现出了惊人的学术嗅觉和执行力。

在微软亚洲研究院联合培养期间，他师从印鉴教授和周明博士——两位都是NLP领域的重量级学者。周明博士曾任MSRA副院长，是亚洲NLP领域的领军人物之一。

进入博士阶段后，郭达雅创造了一个让所有博士生“破防”的纪录：

入学第三天，他就完成了中山大学博士毕业的论文发表要求。

这不是夸张。中大博士毕业通常需要发表若干篇高水平论文，而郭达雅在本科期间积累的成果已经足够满足这一要求。

这意味着什么？意味着从博士生涯的第一天起，他就不再被毕业压力所困，可以纯粹地做自己感兴趣的研究。

这种自由，对于顶级研究者来说，价值连城。

04 竞赛收割机：还没毕业就赢走百万奖金

学术之外，郭达雅还有一个身份：数据挖掘竞赛的“冠军收割机”。

2019-2021年，他连续三年在腾讯广告算法大赛中夺冠。这是国内数据挖掘领域含金量最高的赛事之一，每年吸引数千支队伍参赛。

他还斩获了ATEC科技精英赛、微信大数据挑战赛等多项顶级赛事的冠军。圈内人开玩笑说：“郭达雅还没博士毕业，就已经赢走了上百万的奖金。”

更令人印象深刻的是他在程序员真人秀《燃烧吧！天才程序员》中的表现。这是一场60小时的极限编程挑战，参赛者需要在高压环境下完成复杂的AI任务。郭达雅被评定为仅有的两名SSS级“巨佬”选手之一，向公众展示了顶级程序员在极限状态下的编码实力。

05 DeepSeek时代：GRPO与R1的诞生

2023年博士毕业后，郭达雅面临选择。顶级大厂的offer摆了一桌，但他最终选择了一家当时还不太为人知的公司——DeepSeek。

为什么？

他的回答很简单：“师姐告诉我，这家公司真的想做AGI，而且有足够的资源和支持。”

加入DeepSeek后，郭达雅几乎参与了所有关键模型的研发：

DeepSeek-Coder & Math（2024年初）

作为核心贡献者，他参与开发了当时开源SOTA的代码模型。在这个过程中，他提出了GRPO（Group Relative Policy Optimization）——一种全新的强化学习方法。

GRPO的核心思想是：让模型在多次尝试中自我比较、自我改进，而不依赖人类标注数据。这个想法在当时看来有些激进，但郭达雅坚信这是通向真正智能的关键。

DeepSeek-V2、V3、R1

在V3项目中，郭达雅专注于探索提升模型推理与代码能力的方法。他和团队反复实验，最终将GRPO从理论变成了实践。

结果就是DeepSeek-R1——一个不依赖人工标注、仅通过纯强化学习就能激发大模型推理能力的模型。

R1的发布震惊了AI圈。它证明了：模型可以自己学会“思考”，而不需要人类手把手教它每一步该怎么走。

这一成果最终登上了Nature封面——这是中国AI研究的高光时刻，也是郭达雅个人学术生涯的巅峰。

06 技术哲学：少就是多

在DeepSeek期间，郭达雅形成了自己独特的技术哲学。他在内部讨论中常说：

“数据不是越多越好，关键是你怎么让模型从数据中学会举一反三。”

GRPO的诞生正是这一哲学的体现。传统方法需要大量人工标注的“思维链”数据来训练模型的推理能力，而GRPO让模型在自我博弈中涌现出推理能力。

这种方法不仅大幅降低了数据标注成本，更重要的是——它可能更接近人类智能的本质。人类并不是通过被灌输无数“解题步骤”来学会推理的，而是在不断尝试和错误中，逐渐内化了推理的规律。

07 告别与未来：成为“中山大学的雷军”

2026年3月，郭达雅离职的消息开始在圈内流传。

虽然DeepSeek官方和郭达雅本人都未对此公开回应，但多方信息源证实了这一变动。他的导师印鉴教授的寄语“希望他成为中山大学的雷军”，更像是一种临别赠言。

关于他的下一站，传言很多。有说他要创业的，有说他加入大厂的，甚至有传言说他入职百度——不过后者已被多方核实为误传：确实有DeepSeek核心人才加入百度，但并非郭达雅本人。

无论去向如何，有一点是确定的：这位90后技术天才的故事，远未结束。

08 结语：什么成就了郭达雅？

回看郭达雅的轨迹，有几个关键的“非对称优势”值得深思：

1. 时间套利意识

高考后的自学、本科期间的科研积累、博士入学前的成果准备——他始终在用“提前量”换取未来的自由度。

2. 赛道选择眼光

从MSRA到DeepSeek，他总能在正确的时点进入正确的平台。2023年加入DeepSeek时，这家公司还未出圈，但他看到了别人看不到的愿景。

3. 技术判断力

GRPO的提出不是偶然。在大家都在卷数据规模、模型参数的时候，他选择了一条更本质的路径——让模型学会自主学习。

4. 纯粹的热爱

从竞赛到科研，从综艺到工业界，郭达雅身上始终有一种“玩”的心态。他不是被KPI驱动，而是被好奇心驱动。

郭达雅的故事，是一个关于“快”的故事——学得快、出成果快、成长快。

但真正的启示或许恰恰相反：所有看起来的“快”，都是长期主义结出的果。高考后的那个暑假、博士入学前的那些成果、GRPO背后无数次的实验——这些看不见的积累，才是真正的传奇底色。

无论他下一步走向哪里，AGI的征途上，郭达雅已经留下了自己深刻的足迹。

而我们，可以期待他的下一站。

查看全文

http://www.jsqmd.com/news/523526/

Genus水平共现网络图实战：如何用R语言快速处理OTU数据（附完整代码）

程序员为啥都要学C语言？带你了解C语言的重要性和优势

手把手教你给CH32V307VCT6移植FatFS：SD卡读写与文件管理实战（附源码）

群晖NAS音乐库外网访问终极指南：5分钟搞定内网穿透+手机端秒播（附免费工具推荐）

BJT三极管工作原理图解：从物理结构到电流放大（附NPN/PNP对比）

从零到一：基于 Astro 与 Cloudflare Pages 的极速博客实战

Docker Desktop、Docker Toolbox 和 Docker Engine：如何选择最适合你的Docker工具

2026直冷机市场全景：从工业工艺到数据中心液冷的选型指南 - 品牌推荐大师1

取证实战：当嫌疑人电脑已关机，如何利用EFDD从休眠文件提取BitLocker密钥？

OCPI：构建电动汽车充电网络互联互通的技术解决方案

【第四周】论文精读：SmartChunk: Query-Aware Chunk Compression with Planning for Efficient Document RAG

Multisim DC Sweep双源嵌套扫描实战：5步搞定MOSFET输出特性曲线

WebSocket 握手失败，net::ERR_CONNECTION_RESET问题解决

深入解析transceiver-QPLL：从基础概念到线速率调优实战

你的适应度函数‘欺骗’了你吗？详解遗传算法中的尺度变换与早熟陷阱

DolphinScheduler 3.1.8 资源中心（HDFS）与数据质量任务配置全攻略：告别“存储未启用”

2026年家用晾衣架厂家专业选型指南：手摇/电动/落地/户外/折叠/飘窗/壁挂/铝合金/小户型晾衣架优选供应商 - 品牌推荐官

Linux下如何用aMule下载ed2k资源？保姆级安装配置指南

H5流媒体播放器EasyPlayer.js实战：从零构建跨平台视频播放解决方案

避坑指南：ImageNet-1k数据集解压后验证集图片‘乱放’？一个Python脚本帮你自动归类

广州复读学校哪家强？3大核心维度+10校深度解析 - 妙妙水侠

Arduino BMP180/BMP280气压温度传感器驱动库详解

纯电动汽车两档 ATM 变速箱 Simulink 模型探索

还不知道2026年试验箱去哪选？买试验箱便宜靠谱、优质环境试验箱推广平台网站深度测评 - 品牌推荐大师1

HC-SR501人体红外传感器原理与嵌入式工程实践

嵌入式开源软件工程化选型与风险管控指南

深圳杰和科技有限公司

避开这些坑！Dify LLM参数配置中最容易犯的5个错误及解决方案

迁移学习入门避坑指南：从凯斯西储数据集到MK-MMD实战（轴承故障诊断版）