当前位置: 首页 > news >正文

金宁汇Spiral AI完成关键一棒:在OpenAI颠覆性工作基础上,将Erdős问题下界优化129%

48小时的全球数学难题证明接力

一场围绕80年数学难题的“学术接力”正在上演。

第一棒,5月21日,OpenAI宣布其通用推理模型独立推翻Erdős猜想,给出了一个超线性下界:U(n) ≥ n^{1+δ} / C。这是人类历史上第一次,AI独立解决了一个沉睡80年的核心数学猜想。

第二棒,普林斯顿大学Will Sawin教授迅速将其精确化,利用“类域塔”这一数论明珠,基于单个素数2,将下界确定为 n^{1.014114}。

第三棒,属于金宁汇科技Spiral AI团队。在Sawin结果公布数小时内,金宁汇科技的AI团队基于自主研发的AI for Science长程智能体平台(Spiral AI),完成了决定性的优化与突破。

Spiral AI没有停留在跟随,而是自主探索了更优的构造路径。它不仅创新性地提出并验证了“双素数构造”方案,更关键地证明了在Sawin的框架内,使用两素数是最优的,增加素数数量将导致指数下降。这意味着,Spiral AI找到了该框架下可逼近的理论极限。

经过系统搜寻与优化,Spiral AI确定最优双素数为(2, 3),并找到了最佳参数组合(k(2)=6, k(3)=5, R=7.5),从而将下界指数从 1.014114 显著提升至 1.0323,相对效果提升高达129%。

这项工作不仅是一次关键参数的优化,更是通过AI验证并锁定了现有最优证明路径的理论极限,为后续研究提供了清晰的方向与坚实的基础。它标志着AI在深度参与并推动前沿数学研究进程中,扮演着越来越核心的角色。

Spiral AI相关推导和证明过程

为什么从“一个素数”扩展到“两个素数”?

原来的方法(由普林斯顿大学Will Sawin教授提出)只使用一个素数(比如2)来构造数学结构。Spiral AI 发现,如果改用两个不同的素数(比如2和3),虽然会让某些数值变大(数学上叫“判别式”),但同时也能引入一个额外的增益项。关键在于:增益是否大于代价。通过系统搜索,AI确认了使用两个素数是最优的。

哪两个素数最好?答案是2和3

AI对所有可能的素数对进行了自动搜索和验证,发现(2,3)这一组合能在当前数学框架下给出最大的提升效果。如果换成其他素数对(比如3和5),效果反而变差。

如何找到最优参数?

在确定了素数对(2,3)之后,AI还需要找到三个关键参数:

k(2)k(2) 和 k(3)k(3):分别对应素数2和3的“权重”
RR:一个控制构造规模的实数

AI在以下范围内进行了系统搜索:

k(2),k(3)k(2),k(3) 从1到20
RR 从1.1到20

最终找到的最优组合是:

k(2)=6k(2)=6
k(3)=5k(3)=5
R≈7.5R≈7.5

下界指数提升了多少?

在这个最优参数下,Erdős问题中单位距离数的下界指数从Sawin教授的 1.014114 提升到了 1.0323。虽然看起来只是小数点后的变化,但相对提升幅度高达 129%。这在数论优化中是一个非常显著的进步。

为什么不能用三个或更多素数?

AI还证明了:在当前Sawin框架内,如果使用三个或更多素数(比如2、3、5),会导致“判别式”增长极其迅速(超指数增长),从而使得最终的下界指数迅速趋近于零。换句话说,两个素数就是这个数学路径的极限。

为什么(2,3)比其他素数对更好?

AI通过一个“单调性论证”严格证明了:

如果换成其他素数对,比如(2,5)或(3,5),要么判别式更大,要么增益更小,最终得到的下界指数都会低于(2,3)的结果。

因此,(2,3)不仅是当前框架下的最优选择,而且是理论上不可能再被改进的极限。
附:完整论文草稿《An Optimal Two-Prime Construction for the Erdős Unit Distance Problem》

后记 | 来自Spiral AI团队的思考与开放邀请

在数学面前,我们和我们的AI,始终是学习者。

Spiral AI在此次尝试中的每一步推导,都建立在Will Sawin老师优美而深刻的基础框架之上,也受益于OpenAI所展现的AI+数学的惊人潜力,以及DeepSeek等开源社区的无私贡献。我们由衷致谢。

我们也清醒认识到,数论之海深不可测,AI的推理仍可能存有疏漏。因此,我们已将完整的论文草稿与优化过程公开,诚挚邀请数学界、AI界的各位老师与同仁一同审阅、批评、指正。任何反馈,都是我们持续迭代的关键输入。

倘若我们的探索——哪怕只是一小步,能为这条路径带来一点点启发,或激发更多关于“AI如何协助数学研究”的新思路,那便是我们莫大的欣喜。我们相信,未来科学的发展,将是人类直觉与AI能力彼此激发、紧密协同的旅程。

http://www.jsqmd.com/news/891419/

相关文章:

  • 上海出手黄金计价避坑手册 远离克扣克重不良套路 - 奢侈品回收测评
  • Mi-Create:解锁小米手表个性化表盘设计的创意工具箱
  • 焊盘的温度系数
  • mergepbx开发指南:如何为这个开源工具贡献代码和修复bug
  • Exokit支持的10大硬件平台:从Magic Leap到Oculus全攻略
  • 数字沙盘制作公司怎么选?行业专家给出5个关键判断指标
  • 实际体验Taotoken多模型路由在单一接口故障时的自动切换
  • C++ cmath库宏常量全解析:从M_PI到M_SQRT2的实战应用指南
  • ChatGPT插件安装黑盒解析:基于Chrome DevTools Protocol的插件注入时序图(含WebSocket handshake抓包对照表)
  • Seaborn热力图实战指南:从数据预处理到出版级可视化
  • 全国GEO精准引流服务机构实力排行权威盘点 - 奔跑123
  • VASP AIMD数据别浪费!用DynaPhoPy提取非谐声子谱的保姆级教程
  • 2026年湖南钢模板定制租赁完全指南:从工期焦虑到资产增值的闭环解决方案 - 企业名录优选推荐
  • 基于云计算的分布式嵌入式系统仿真平台NetShip架构与实践
  • WPS 文字 表格美化(三线表)操作步骤解析
  • GitHut 2.0开发者指南:构建自己的GitHub数据分析平台
  • 旺哥黄金回收(连锁品牌)|2026年5月华宁黄金回收行情,连锁保障高价回收 - 润富黄金珠宝行
  • mailgo高级技巧:如何通过自定义动作实现邮件链接与CRM系统无缝集成
  • 3分钟掌握Buzz:离线音频转录与翻译的全能解决方案
  • 镇江黄金回收六大品牌测评(2026年5月)|全市覆盖+实时金价+靠谱商家分级推荐 - 润富黄金珠宝行
  • 中山洗水沙供货企业深度解析:资质、产能与产品适配度全拆解 - 品牌推荐大师
  • GVM环境诊断与重建:从gvm-check-setup报错到全链路贯通
  • ChatGPT使用限制解除全链路拆解(2024年最新GPT-4o/Turbo绕限白皮书)
  • 2026年5月恩施旺哥黄金回收(连锁品牌)实时回收价格|行情解读+变现案例+避坑技巧+FAQ,恩施宣恩全县街道覆盖 - 润富黄金珠宝行
  • 如何实现LG WebOS电视的智能自动化控制:完整技术指南
  • 正态性检验实战指南:从Q-Q图到Shapiro-Wilk的工程化核查
  • 2026年武夷山酒店推荐哪家好?TOP5酒店排名评测指南 - 江湖评测
  • KMS_VL_ALL_AIO:一站式高效解决Windows与Office激活难题的实用方案
  • 2026福建省龙岩市寄快递省钱攻略!4个正规底价平台,个人商家、乡镇大件全覆盖 - 时讯资讯
  • 为什么Rust中调用泛型函数要用::分隔函数名和泛型参数?