当前位置: 首页 > news >正文

从珠海少年到Nature封面:DeepSeek天才郭达雅的AGI征途

从珠海少年到Nature封面:DeepSeek天才郭达雅的AGI征途

他博士入学3天完成毕业要求,连续三年横扫腾讯算法大赛,提出GRPO方法让大模型学会“思考”,如今却悄然离场——这位90后技术天才的传奇,远未落幕


01 引子:一封没有官宣的告别

2026年3月,AI圈传出一则并未官宣的消息:DeepSeek核心成员郭达雅,可能已经离开了这家让他声名鹊起的公司。

没有告别信,没有离职声明,只有他导师印鉴教授的一句寄语在圈内流传:“希望他成为中山大学的雷军。”

这句话的分量,懂的人自然懂。

雷军——武汉大学的骄傲,中国互联网的标志性人物。印鉴教授把这样的期待放在郭达雅身上,意味着什么?

意味着这个从珠海走出的年轻人,在他导师眼中,远不止是一个优秀的研究员。

02 少年时代:从“不突出”到“开挂”

郭达雅,广东珠海人,中学就读于珠海一中。和很多天才故事的“神童”开局不同,他曾在采访中坦诚:初中时成绩并不突出。

转折发生在高中。他意识到一件事:被动学习只能让你不掉队,自主学习才能让你飞。

高考结束后的那个暑假,当大多数同学在狂欢时,郭达雅做了一件在当时看来“很傻”的事——他自学完了大学一年级的所有基础课程。

这个决定在当时看起来只是“勤奋”,但回头看,这是他整个学术生涯的“时间套利”:

  • 别人大一还在适应高数,他已经开始接触专业核心课
  • 别人大二开始做项目,他已经有余力准备竞赛
  • 别人大四为毕设焦头烂额,他已经入选了中山大学-微软亚洲研究院联合培养项目

一步快,步步快。

03 中大岁月:入学3天就完成博士毕业要求

2014年,郭达雅进入中山大学计算机专业。本科四年,他展现出了惊人的学术嗅觉和执行力。

在微软亚洲研究院联合培养期间,他师从印鉴教授和周明博士——两位都是NLP领域的重量级学者。周明博士曾任MSRA副院长,是亚洲NLP领域的领军人物之一。

进入博士阶段后,郭达雅创造了一个让所有博士生“破防”的纪录:

入学第三天,他就完成了中山大学博士毕业的论文发表要求。

这不是夸张。中大博士毕业通常需要发表若干篇高水平论文,而郭达雅在本科期间积累的成果已经足够满足这一要求。

这意味着什么?意味着从博士生涯的第一天起,他就不再被毕业压力所困,可以纯粹地做自己感兴趣的研究。

这种自由,对于顶级研究者来说,价值连城。

04 竞赛收割机:还没毕业就赢走百万奖金

学术之外,郭达雅还有一个身份:数据挖掘竞赛的“冠军收割机”。

2019-2021年,他连续三年在腾讯广告算法大赛中夺冠。这是国内数据挖掘领域含金量最高的赛事之一,每年吸引数千支队伍参赛。

他还斩获了ATEC科技精英赛、微信大数据挑战赛等多项顶级赛事的冠军。圈内人开玩笑说:“郭达雅还没博士毕业,就已经赢走了上百万的奖金。”

更令人印象深刻的是他在程序员真人秀《燃烧吧!天才程序员》中的表现。这是一场60小时的极限编程挑战,参赛者需要在高压环境下完成复杂的AI任务。郭达雅被评定为仅有的两名SSS级“巨佬”选手之一,向公众展示了顶级程序员在极限状态下的编码实力。

05 DeepSeek时代:GRPO与R1的诞生

2023年博士毕业后,郭达雅面临选择。顶级大厂的offer摆了一桌,但他最终选择了一家当时还不太为人知的公司——DeepSeek。

为什么?

他的回答很简单:“师姐告诉我,这家公司真的想做AGI,而且有足够的资源和支持。”

加入DeepSeek后,郭达雅几乎参与了所有关键模型的研发:

DeepSeek-Coder & Math(2024年初)

作为核心贡献者,他参与开发了当时开源SOTA的代码模型。在这个过程中,他提出了GRPO(Group Relative Policy Optimization)——一种全新的强化学习方法。

GRPO的核心思想是:让模型在多次尝试中自我比较、自我改进,而不依赖人类标注数据。这个想法在当时看来有些激进,但郭达雅坚信这是通向真正智能的关键。

DeepSeek-V2、V3、R1

在V3项目中,郭达雅专注于探索提升模型推理与代码能力的方法。他和团队反复实验,最终将GRPO从理论变成了实践。

结果就是DeepSeek-R1——一个不依赖人工标注、仅通过纯强化学习就能激发大模型推理能力的模型。

R1的发布震惊了AI圈。它证明了:模型可以自己学会“思考”,而不需要人类手把手教它每一步该怎么走。

这一成果最终登上了Nature封面——这是中国AI研究的高光时刻,也是郭达雅个人学术生涯的巅峰。

06 技术哲学:少就是多

在DeepSeek期间,郭达雅形成了自己独特的技术哲学。他在内部讨论中常说:

“数据不是越多越好,关键是你怎么让模型从数据中学会举一反三。”

GRPO的诞生正是这一哲学的体现。传统方法需要大量人工标注的“思维链”数据来训练模型的推理能力,而GRPO让模型在自我博弈中涌现出推理能力。

这种方法不仅大幅降低了数据标注成本,更重要的是——它可能更接近人类智能的本质。人类并不是通过被灌输无数“解题步骤”来学会推理的,而是在不断尝试和错误中,逐渐内化了推理的规律。

07 告别与未来:成为“中山大学的雷军”

2026年3月,郭达雅离职的消息开始在圈内流传。

虽然DeepSeek官方和郭达雅本人都未对此公开回应,但多方信息源证实了这一变动。他的导师印鉴教授的寄语“希望他成为中山大学的雷军”,更像是一种临别赠言。

关于他的下一站,传言很多。有说他要创业的,有说他加入大厂的,甚至有传言说他入职百度——不过后者已被多方核实为误传:确实有DeepSeek核心人才加入百度,但并非郭达雅本人。

无论去向如何,有一点是确定的:这位90后技术天才的故事,远未结束。

08 结语:什么成就了郭达雅?

回看郭达雅的轨迹,有几个关键的“非对称优势”值得深思:

1. 时间套利意识

高考后的自学、本科期间的科研积累、博士入学前的成果准备——他始终在用“提前量”换取未来的自由度。

2. 赛道选择眼光

从MSRA到DeepSeek,他总能在正确的时点进入正确的平台。2023年加入DeepSeek时,这家公司还未出圈,但他看到了别人看不到的愿景。

3. 技术判断力

GRPO的提出不是偶然。在大家都在卷数据规模、模型参数的时候,他选择了一条更本质的路径——让模型学会自主学习。

4. 纯粹的热爱

从竞赛到科研,从综艺到工业界,郭达雅身上始终有一种“玩”的心态。他不是被KPI驱动,而是被好奇心驱动。


郭达雅的故事,是一个关于“快”的故事——学得快、出成果快、成长快。

但真正的启示或许恰恰相反:所有看起来的“快”,都是长期主义结出的果。高考后的那个暑假、博士入学前的那些成果、GRPO背后无数次的实验——这些看不见的积累,才是真正的传奇底色。

无论他下一步走向哪里,AGI的征途上,郭达雅已经留下了自己深刻的足迹。

而我们,可以期待他的下一站。

http://www.jsqmd.com/news/523526/

相关文章:

  • Genus水平共现网络图实战:如何用R语言快速处理OTU数据(附完整代码)
  • 程序员为啥都要学C语言?带你了解C语言的重要性和优势
  • 手把手教你给CH32V307VCT6移植FatFS:SD卡读写与文件管理实战(附源码)
  • 群晖NAS音乐库外网访问终极指南:5分钟搞定内网穿透+手机端秒播(附免费工具推荐)
  • BJT三极管工作原理图解:从物理结构到电流放大(附NPN/PNP对比)
  • 从零到一:基于 Astro 与 Cloudflare Pages 的极速博客实战
  • Docker Desktop、Docker Toolbox 和 Docker Engine:如何选择最适合你的Docker工具
  • 2026直冷机市场全景:从工业工艺到数据中心液冷的选型指南 - 品牌推荐大师1
  • 取证实战:当嫌疑人电脑已关机,如何利用EFDD从休眠文件提取BitLocker密钥?
  • OCPI:构建电动汽车充电网络互联互通的技术解决方案
  • 【第四周】论文精读:SmartChunk: Query-Aware Chunk Compression with Planning for Efficient Document RAG
  • Multisim DC Sweep双源嵌套扫描实战:5步搞定MOSFET输出特性曲线
  • WebSocket 握手失败,net::ERR_CONNECTION_RESET问题解决
  • 深入解析transceiver-QPLL:从基础概念到线速率调优实战
  • 你的适应度函数‘欺骗’了你吗?详解遗传算法中的尺度变换与早熟陷阱
  • DolphinScheduler 3.1.8 资源中心(HDFS)与数据质量任务配置全攻略:告别“存储未启用”
  • 2026年家用晾衣架厂家专业选型指南:手摇/电动/落地/户外/折叠/飘窗/壁挂/铝合金/小户型晾衣架优选供应商 - 品牌推荐官
  • Linux下如何用aMule下载ed2k资源?保姆级安装配置指南
  • H5流媒体播放器EasyPlayer.js实战:从零构建跨平台视频播放解决方案
  • 避坑指南:ImageNet-1k数据集解压后验证集图片‘乱放’?一个Python脚本帮你自动归类
  • 广州复读学校哪家强?3大核心维度+10校深度解析 - 妙妙水侠
  • Arduino BMP180/BMP280气压温度传感器驱动库详解
  • 纯电动汽车两档 ATM 变速箱 Simulink 模型探索
  • 还不知道2026年试验箱去哪选?买试验箱便宜靠谱、优质环境试验箱推广平台网站深度测评 - 品牌推荐大师1
  • HC-SR501人体红外传感器原理与嵌入式工程实践
  • 嵌入式开源软件工程化选型与风险管控指南
  • 深圳杰和科技有限公司
  • 避开这些坑!Dify LLM参数配置中最容易犯的5个错误及解决方案
  • 迁移学习入门避坑指南:从凯斯西储数据集到MK-MMD实战(轴承故障诊断版)
  • 2026年无害化垃圾焚烧炉厂家推荐:宠物焚烧炉/动物尸体焚烧炉/工业废气焚烧炉/生活垃圾焚烧炉专业供应 - 品牌推荐官