ChatGPT 5.5 Pro一小时攻克博士级数学难题,引发数学研究范式变革
菲尔兹奖得主Timothy Gowers记录了使用未发布的ChatGPT 5.5 Pro进行数学研究的经历。这款AI模型约一小时就完成多项博士级原创数学研究,解决了组合数学领域的开放性问题,让学术界重新评估AI数学能力。
早期大语言模型解决数学问题常被质疑只是检索文献或简单推导已知结果,而ChatGPT 5.5 Pro能识别被人类忽略的简洁论证,在缺乏完整理论框架时构建原创证明思路,且Gowers几乎没提供实质性数学输入,提示词设计也未特别优化。
Gowers选择测试的Nathanson问题涉及加性数论中和集直径上界的估计。MIT本科生Isaac Rajagopal曾证明直径关于k呈指数级增长,而ChatGPT 5.5 Pro在引导下逐步改进结果。
首次尝试,模型16分41秒将上界从关于k的指数改进为关于k^α的指数(α>1/2)。之后在Gowers要求下,继续探索多项式上界,13分33秒表示对存在多项式界持乐观态度并识别需验证命题,9分12秒自我验证后完成完整证明,总用时约一小时。Rajagopal认为证明“几乎肯定正确”,核心思想可靠。
ChatGPT 5.5 Pro完成的工作达到发表水平,但投稿传统期刊意义不大,因成果可自由获取且无“署名权”争议。arXiv拒绝接受AI撰写内容,Gowers建议建立专门的AI数学成果仓库,由人类数学家审核或经形式化验证工具确认后收录。
传统上,组合数学等领域的新参数研究产生的问题是研究生入门研究的理想素材。但随着AI能力提升,“入门级别”开放问题门槛迅速抬高。
过去提出问题就有研究价值,现在问题必须足够难,LLM无法解决才行。这对数学教育、研究生培养和学术评价体系产生连锁反应,人类数学家的角色定位、研究方法和职业发展路径都需重新定义。
编辑观点:ChatGPT 5.5 Pro在数学研究上的突破意义重大,虽成果归属和传播有困境,但为AI在纯数学领域应用提供实证,未来或重塑数学研究生态。
