当前位置：首页 > news >正文

每日文献阅读-复现｜2026 npj Computational Materials：130 万候选如何用 AI 与第一性原理筛出 741 种超导体

news 2026/7/4 3:12:12

在计算材料发现中，机器学习最有价值的角色并不是替代第一性原理，而是把昂贵计算留给最值得验证的候选。本文介绍一项 2026 年超导材料发现工作：从 130 多万晶体结构出发，通过多级机器学习、DFT、声子和电子-声子耦合计算，最终得到 741 个 Tc 高于 5 K 的稳定候选，并完成两种材料的合成与低温实验验证。

论文信息

题目：Developing a complete AI-accelerated workflow for superconductor discovery
期刊：npj Computational Materials
正式发表：2026 年 1 月 27 日
DOI：10.1038/s41524-026-01964-8
计算软件：VASP、Quantum ESPRESSO、Pymatgen
核心模型：M3GNet、MEGNet、BEE-NET
研究对象：常压、电子-声子机制主导的传统超导材料

这篇论文最值得关注的并不是“AI 找到了超导体”这一句话，而是作者如何把机器学习、第一性原理和实验安排在不同成本层级上。

为什么超导材料不适合直接进行百万级 DFT 扫描

对于传统超导体，临界温度 Tc 与电子-声子相互作用密切相关。比单独预测一个 Tc 数字更有物理信息量的是 Eliashberg 谱函数 α²F(ω)：它描述不同频率声子对电子配对的贡献，并可进一步得到电子-声子耦合常数和 Allen-Dynes Tc。

问题在于，高质量 α²F(ω) 需要密集的电子、声子和电子-声子计算。单个材料已经昂贵，直接对百万级结构逐一计算几乎不可行。

作者因此没有让机器学习和 DFT 做同一件事，而是把整个流程拆成三种职责。

图 1｜计算资源的分层使用：机器学习负责快速过滤，第一性原理确认稳定性与超导性质，实验检验材料能否制备并出现超导转变。

两个起点：已知材料数据库与元素替位生成

候选结构来自两条路线。

第一条路线从 Materials Project 和 Alexandria 数据库中查询金属材料，限制单位胞不超过 12 个原子，并允许一定的凸包上能量窗口，得到约 8.57 万个已知结构。

第二条路线使用部分 Wyckoff 位点元素替换。作者从实验已知的非磁性金属母相出发，用周期表邻近元素替换部分占位，生成约 122 万个新结构。

每个候选都要依次回答五个问题：

是否为金属？
形成能是否合理？
是否具有足够的热力学稳定性？
声子谱是否不存在虚频，即动力学是否稳定？
第一性原理计算的 Tc 是否高于 5 K？

从 122 万到 5,600：先不运行一次 DFT

对于 122 万个元素替位结构，作者先用 M3GNet 预弛豫，再用 MEGNet 预测带隙和形成能，随后由只读取晶体结构的 CSO BEE-NET 预测 α²F(ω) 与 Tc，并用近似凸包稳定性继续过滤。

经过这些快速模型，122 万个生成结构缩减到 5,600 个。到这一步，尚未对这些候选运行正式 DFT。

图 2｜生成材料支路与最终高成本计算阶段。数字根据论文 Results 与 Methods 整理；左侧 122 万至 1,300 对应元素替位生成支路，右侧 866 至 2 对应最终汇总与实验验证。

剩余候选随后使用 DFT 重新弛豫。作者再计算粗粒化的 2×2×2 q 点声子谱，仅保留没有虚频的动力学稳定结构，并将 DFT 结构和粗粒化声子态密度输入 CPD BEE-NET。

最终只有 866 个候选进入最昂贵的高精度 α²F(ω) 计算，其中 741 个得到 DFT Tc>5 K，整体精确率为 86%；另有 69 个候选的 DFT Tc 不低于 20 K。

这里必须避免一个常见误读：69 个高 Tc 计算候选，不等于 69 种材料已经合成，更不等于实验获得了 20 K 超导。

BEE-NET 为什么不直接预测 Tc

BEE-NET 是由 100 个等变图神经网络组成的 bootstrap 集成。训练数据包含约 7,000 条由 DFT 计算得到的 α²F(ω)，按 80% 训练、20% 测试划分。

论文设置了两种输入：

CSO：只读取晶体结构，适合百万级快速筛选；
CPD：在晶体结构之外加入粗粒化声子态密度，计算成本更高，但精度更好。

图 3｜CSO 与 CPD 的测试集指标。数值来自论文 Table 1 和 Table 2，展示 EMD 损失下的 Tc 回归结果及真负率。

在 EMD 损失下，加入声子信息后，Tc MAE 从 1.20 K 降至 0.87 K，R² 从 0.66 提升到 0.79。

但作者在实际筛选时更看重“能否正确排除非超导候选”。MSE 模型虽然回归误差不是最小，却让 CPD 的真负率达到 99.4%，因此更适合减少无效 DFT 计算。

99.4% 不是“整体预测准确率”。同一模型的真正率约为 63%，意味着提高真负率的同时也会漏掉部分真实正例。这正是高通量筛选中精确率、召回率与计算预算之间的权衡。

对作者开放的 5,241 个 CIF 做一次独立复核

作者在 GitHub 仓库中发布了模型、训练/测试索引、工作流以及 5,241 个 CIF 晶体结构。本次复核逐一解析了这些 CIF，未发现无法读取的文件。

图 4｜GitHub 开放 CIF 的元素频率、单位胞规模和组分复杂度。该统计对应模型训练/测试结构，不代表最终 741 个候选的组成分布。

复核结果显示：

5,241 个结构覆盖 65 种元素；
单位胞包含 1 至 10 个原子，平均为 4.54 个，中位数为 4 个；
三元化合物最多，共 3,688 个；
Ti、Rh、Al、Ru 和 Sc 出现频率最高；
与最终实验体系相关的 Nb、Hf 和 Be 分别出现在 629、331 和 283 个训练/测试结构中。

这些结果说明训练数据并非围绕单一化学体系构建，但也需要注意：GitHub 发布的 5,241 个 CIF 是训练/测试结构，不是最终 741 个候选的结构全集，不能用这张分布图推断最终候选库的元素偏好。

从计算候选到实验样品

作者最终选择了由 Be2Nb3 母相替位得到的 Be2Hf2Nb 和 Be2HfNb2。初筛 DFT Tc 分别为 14.9 K 和 7.5 K；在增加 k 点密度并采用 μ*=0.21 重新计算后，Tc 调整为 9.3 K 和 5.1 K。

图 5｜高精度 DFT Tc 与实验电阻转变起始温度。数据来自论文 p.5-p.6；连线只用于显示同一材料的理论与实验结果，不表示统计误差。

低温电阻实验观察到 3.18 K 和 4.24 K 的转变。两种样品的剩余电阻率比 RRR 均约为 1，提示存在明显无序。

进一步的比热结果显示，Be2Hf2Nb 在约 2 K 以下呈现整体超导；Be2HfNb2 则出现两个比热跃迁，说明样品可能包含两个超导相。XRD 精修也需要考虑 Hf/Nb 占位无序和杂相。

因此，DFT 与实验 Tc 不完全一致并不能简单归因于模型失败。计算对应理想化结构和选定的库仑赝势，实验面对的则是无序、杂相、占位和真实样品质量。

这篇论文真正证明到了哪一步

图 6｜研究证据边界：机器学习命中、DFT 确认与实验观察分别回答不同问题，不能直接跨越到器件或工程应用结论。

现有证据支持以下结论：

该流程能够从百万级材料空间中筛出值得进行高成本第一性原理计算的候选；
741 个候选在作者的 DFT 条件下同时满足稳定性要求和 Tc>5 K；
两种 Hf 替位样品被成功制备，并在低温实验中出现超导转变。

但现有证据还不能说明：预测的纯相结构和占位已被完全实验重建；材料已经具有高温或实用超导性能；材料能够直接用于电网、磁体、量子器件或规模化制造。

技术评价：最强的地方与仍需谨慎的地方

这项工作的优势主要体现在四点。

第一，模型学习的是 α²F(ω)，而不只是一个 Tc 标签，因此保留了更多电子-声子物理信息。第二，筛选采用逐级增加成本的设计，避免把昂贵计算平均浪费在所有候选上。第三，最终结果接受了 DFT、XRD、电阻率和比热的连续检验。第四，代码和训练/测试数据公开，便于检查模型与数据组成。

同时仍有四个边界。

模型只学习到 100 meV 以内、常压条件下的 α²F(ω)，不能直接用于高压氢化物；
该框架主要针对传统电子-声子超导体，不能直接外推到非常规超导；
M3GNet 对凸包上能量系统性低估约 140 meV/atom，宽松阈值有利于召回，但降低精确率；
实验只验证了两种低 Tc 样品，其中一种存在多相信号，距离实际器件仍然很远。

阅读结论

这篇论文提供了一个很清楚的计算材料范式：机器学习负责缩小搜索空间，第一性原理负责确认物理可行性，实验负责决定预测是否能在真实材料中出现。

真正的进步并不是“AI 替代 DFT”，而是让每一种工具都出现在最适合的成本层级。对于高通量第一性原理工作，这种计算预算的组织方式，比单纯追求更大的候选库更值得借鉴。

原文、代码与数据

npj Computational Materials 论文页面
论文 DOI
BEE-NET 代码与训练/测试结构
论文许可：CC BY-NC-ND 4.0

图片说明：本文未直接转载论文图像；图表根据论文报告的数值、方法描述以及作者开放的 CIF 数据重新组织。数据来源和适用范围已在相应图注中说明。

本文涉及的文献检索、深度精读、证据核验、科研制图与博客整理，智澈乐尚网络工作平台均可协助完成；如有类似需求，欢迎联系我们。

查看全文

http://www.jsqmd.com/news/1119106/

PCB焊盘设计：SMD与NSMD的选择与应用

华为MetaERP Oracle EBS 各模块业务场景与会计分录对照表。由于无法直接生成 Excel 文件，我将以清晰的表格格式呈现，你可以直接复制到 Excel 中使用。Oracle EBS 各

助睿实验指导7：自媒体运营分析三次过程合并-CSDN博客

亲测速度几十MB/s！2026百度网盘不限速下载黑科技，原来大家都偷偷在用

影刀RPA新手教程：邮件自动发送完全指南——从SMTP配置到批量个性化发送

（六）海康工业相机与halcon+C#联合编程

Claude Code安全审查实战：从SQL注入检测到CI/CD集成指南

92.从底层原理、编程规范、模块化设计到调试避坑！PLC ST 语言工控项目全流程实战

120 万奖金池里，有一块没人抢的肥肉：RWKV-7 × transformers 训练适配

RAG落地踩坑实录：从Demo到生产的差距有多大？

S1.1 独立产品的变现模式地图：哪种模式最适合你

通过结构化步骤化解社恐压力

Dify 实战指南：从零构建企业级 AI 应用与工作流

华为MetaERP Oracle EBS 各模块业务场景及会计分录汇总表文件信息：共 11个模块 | 300条业务场景 | 编制日期：2026年7月模块目录表格序号模块名称业务场景数主

CBC模式密文篡改攻击：无需密钥，直接实现权限提升

OpenHarmony Button 按钮组件全场景开发与 API23 + 适配优化

做电子元器件生产的朋友，国内线圈固定胶生产厂家哪家更靠谱？

分享一个连DeepSeek都说“颜值高”的代码截图工具

Dify实战指南：一周构建企业级AI应用，从零到精通

RAG效果评估：你的知识库到底好不好用？

abu_tcp 自定义安全协议源码拆解

一套正版、免费、强大的 Visual Studio 2012 IDE

Azure Local 离线模式网络规划（系列篇之二）

SpringBoot3 + Java21 虚拟线程实战：吞吐量提升 300%，彻底告别线程池调优

Install with Options：Android高级安装的终极解决方案

Insta360 AI剪辑深度解析：从原理到实践，重塑视频创作效率

0Ω电阻在PCB设计中的五大核心功能与应用技巧

PHP安全编码实践指南：从纵深防御到SQL注入与XSS防护

企业级RAG架构：权限控制、安全防护与多租户

qt启动等待动态图