当前位置：首页 > news >正文

机器学习原子间势结合主动学习：高效预测溶液体系光谱性质

news 2026/7/18 22:55:16

1. 项目概述与核心挑战

在计算化学和材料科学领域，预测分子在溶液环境下的光谱性质，比如紫外-可见吸收光谱和荧光发射光谱，一直是个既关键又棘手的难题。这不仅仅是算出一个数字那么简单，它直接关系到我们如何理解分子在真实环境（比如细胞液、化学反应溶剂）中的行为，是连接微观分子结构与宏观可观测性质的核心桥梁。

传统上，我们依赖第一性原理方法，比如含时密度泛函理论来做这件事。它的原理很直接：基于量子力学，理论上可以给出非常精确的电子激发能。但问题出在“溶剂环境”上。分子不是孤零零地飘在真空里，它被一层层溶剂分子包围、碰撞、相互作用。要准确模拟这种效应，你需要对成千上万个原子构成的体系，进行长时间尺度的分子动力学模拟，从中采样出成千上万个不同的分子构型，然后对每一个构型都做一次昂贵的TD-DFT计算来得到激发能。这个计算量是天文数字，对大多数研究组和实际应用来说，几乎是不可完成的。

这就引出了本项目的核心：我们能否找到一个既快又准的“替身”，来代替昂贵的量子化学计算，去完成那海量的构型采样和能量评估？

机器学习原子间势正是为此而生。它的核心思想听起来很巧妙：我们不从头去解复杂的薛定谔方程，而是让机器学习模型从有限的高精度量子化学计算结果中“学习”原子间的相互作用规律。一旦模型训练好了，它就能像一个经验丰富的老师傅，看一眼原子排布（几何构型），就瞬间报出整个体系的能量、受力，甚至是我们最关心的——不同电子态之间的能量差。这样一来，用MLIP驱动分子动力学模拟，其速度可以比传统量子化学方法快几个数量级，使得对溶液体系进行充分的系综采样变得可行。

然而，理想很丰满，现实却很骨感。训练一个靠谱的MLIP，尤其是用于光谱预测的MLIP，面临几个核心挑战：

数据饥渴与效率悖论：MLIP需要大量高质量的量子化学数据来训练。但生成这些数据本身就很贵（TD-DFT计算）。我们如何在保证模型精度的前提下，用最少的高成本计算，获得最具代表性的训练数据？
激发态势能面的复杂性：预测吸收和发射光谱，不仅需要基态势能面，还需要激发态势能面。更重要的是，发射光谱对应的是从激发态极小点附近向基态势能面（可能远离其极小点）的垂直跃迁。这意味着我们的训练数据必须能充分覆盖基态和激发态势能面上这些“非平衡”的、能量较高的区域，而不仅仅是两个势能面各自的能量最低点附近。
长程相互作用与尺寸效应：溶剂效应不是只靠第一层溶剂分子就能描述的。氢键、π-π堆积、长程的静电和色散相互作用，都需要在足够大的溶剂团簇中才能被准确捕捉。MLIP能否在训练时只见过小尺寸团簇的情况下，可靠地预测更大尺寸团簇的性质？
误差控制与抵消：光谱对应的是两个电子态之间的能量差。如果我们分别用两个独立的MLIP来预测基态和激发态的能量，那么两个模型各自的误差会传递到能量差中。如果这两个误差一正一负，可能会幸运地部分抵消；但如果它们同向叠加，结果就会惨不忍睹。如何系统性地减少这种误差传递？

面对这些挑战，华威大学团队开发的ESTEEM工作流，结合主动学习策略，为我们提供了一个优雅而强大的自动化解决方案。下面，我就以他们研究尼罗红在三种不同溶剂（环己烷、乙醇、乙腈）中的光谱为例，拆解这套工作流是如何一步步攻克上述难题，最终实现高效、准确的光谱预测的。

2. ESTEEM自动化工作流深度解析

ESTEEM不是一个单一的软件，而是一个高度模块化、可定制的工作流管理框架。它的设计哲学很清晰：将光谱预测这个复杂任务，拆解成一系列标准化的、可重复执行的“任务”，并通过Python脚本串联和协调这些任务，调用外部专业软件（如ORCA做量子化学计算，MACE训练MLIP，AMBER做经典MD）来完成具体工作。这种设计让整个流程变得透明、可复现，并且易于针对不同体系进行调整。

2.1 系统准备：打好数据地基

万事开头难，MLIP训练的第一步是获得高质量的“种子”数据。ESTEEM的工作流从这里开始。

2.1.1 溶质与溶剂的初始优化首先，你需要确定研究的分子。以尼罗红为例，其初始几何结构可以从PubChem等数据库获取。接着，ESTEEM会调用量子化学软件（如ORCA）执行一系列计算：

真空优化：将分子在真空中进行几何优化，得到一个初始的稳定结构。
隐式溶剂优化：将优化好的分子置于隐式溶剂模型（如CPCM）中再次优化。这一步非常关键，它模拟了溶剂环境的平均极化效应，能得到更接近溶液中的真实分子构型。对于尼罗红这种极性可变的分子，在不同溶剂（环己烷非极性、乙醇和乙腈极性）中，其最优构型可能有细微差别，这一步能将其区分开。
垂直激发能计算：在隐式溶剂优化后的几何结构上，计算从基态到前几个激发态的垂直激发能。这为我们后续评估方法（如TD-DFT泛函、基组的选择）是否合理提供了一个快速基准。

实操心得：隐式溶剂模型的选择和参数设置需要谨慎。虽然它速度快，但只能处理平均的、连续的溶剂效应，无法描述特定的分子间相互作用（如氢键）。对于乙醇、乙腈这类能形成强氢键的溶剂，后续的显式溶剂模拟至关重要，但隐式优化这步能为显式模拟提供一个更合理的起始点。

2.1.2 构建显式溶剂化体系与经典MD预平衡得到优化后的溶质和溶剂分子结构后，下一步是构建一个包含周期性边界条件的“溶液盒子”。

溶剂化：使用如PackMol这样的工具，将单个溶质分子放入一个充满溶剂分子的立方体盒子中心。盒子的尺寸和溶剂分子数量需要精心设置，以确保溶质被充分溶剂化，同时避免因盒子太小导致溶质与自己的镜像发生非物理相互作用。文中给出的盒子尺寸（约13-15 Å）和分子数（74-380个）是经过权衡计算成本和溶剂化完整性后的典型选择。
经典分子动力学预平衡：直接用高精度方法模拟这么大规模的体系不现实。因此，ESTEEM先使用经典的、快速的分子力场（如AMBER力场）进行长时间的MD模拟来使体系达到平衡。这个过程通常分几步：
- 约束加热：在NVT系综下，将体系从0 K缓慢加热到目标温度（如300 K）。初期通常会约束含氢键的键长，防止因高频振动导致模拟不稳定。
- 密度平衡：在NPT系综下运行，调节盒子大小，使体系的密度达到实验值或目标值。
- 无约束平衡与生产采样：回到NVT系综，放开所有约束，进行长时间模拟以充分采样相空间。从这段“生产轨迹”中，每隔一定时间步长（如200步）抽取一个“快照”。这些快照代表了溶液体系在热力学平衡下的各种可能构型，是后续生成训练数据的宝库。

2.1.3 “雕刻”团簇与高精度单点计算直接从包含数百个原子的周期性盒子中做量子化学计算，仍然非常昂贵。因此，ESTEEM采用了一种聪明的“雕刻”策略。

雕刻：对于每一个MD快照，以溶质分子为中心，画一个半径为R_carve的球。只保留球内的溶剂分子，删除球外的。同时，还可以设置一个原子数上限N_atoms，如果雕刻后的原子数超过这个值，就从外层开始删除溶剂分子，直到满足要求。
为什么这么做？溶剂效应主要来自溶质周围的第一、二层溶剂壳层。远处的溶剂分子对溶质电子结构的直接影响很小，但计算成本却随原子数呈O(N^3)或更糟的增长。雕刻能在保留核心相互作用的前提下，极大降低计算量。文中对溶液体系使用了较小的R_carve（2.35-3.0 Å），就是为了生成大小可控（130-180原子）的训练团簇。
高精度单点计算：对这些雕刻好的团簇，使用选定的高精度量子化学方法（本文是PBE0泛函的DFT和TD-DFT）进行单点能计算。对于溶液团簇，需要计算其基态和第一激发态的总能量、原子受力和偶极矩。对于纯溶剂团簇，则只需计算基态性质（假设溶剂在光学上是惰性的）。

核心考量：R_carve的选择是一门艺术。太小，会丢失重要的溶剂-溶剂长程相互作用，导致模型无法外推到大体系；太大，则单点计算成本激增，限制了训练数据的数量。ESTEEM后续的主动学习过程，正是为了用最少的小团簇数据，训练出能预测大体系性质的稳健模型。

2.2 主动学习循环：让数据收集“聪明”起来

有了初始的一批高精度数据后，就可以开始训练第一代MLIP了。但如果我们只使用这批静态数据，模型很可能只在训练数据覆盖的相空间区域表现良好，对于没见过的构型（尤其是激发态动力学采样到的那些高能构型）预测误差会很大。这就是主动学习大显身手的地方。

2.2.1 MLIP训练与委员会模型ESTEEM支持多种MLIP架构，本文使用的是目前公认的先进架构——消息传递图神经网络。它的优势在于能通过多层“消息传递”迭代，让每个原子的特征向量包含其周围越来越广的化学环境信息，从而更好地捕捉多体相互作用。

训练策略：训练分两阶段。第一阶段，损失函数更侧重于准确预测原子受力。这是因为受力直接对应势能面的梯度，对力拟合得好，模型学到的势能面形状（曲率）才更准确，这对后续的分子动力学模拟的稳定性至关重要。第二阶段，损失函数更侧重于准确预测总能量，确保能量的绝对值也可靠。
委员会模型：对于同一个体系（如尼罗红在乙醇中），我们不是只训练一个模型，而是用不同的随机种子初始化，训练多个（如5个）独立的模型，组成一个“委员会”。这有什么用？后面会看到，这是主动学习选择新训练点的关键。

2.2.2 用MLIP采样新构型与不确定性评估训练好第一代MLIP委员会后，我们用它们来驱动新的分子动力学模拟。

MLIP-MD采样：从之前的经典MD轨迹中随机选取一个快照作为起点，用训练好的基态和激发态MLIP分别进行NVT系综的MD模拟，产生新的轨迹。这一步成本极低，因为MLIP评估一次能量/受力比DFT快成千上万倍。
评估不确定性：从这些新的MLIP-MD轨迹中，再次“雕刻”出团簇。关键来了：对于同一个团簇，我们用委员会里的所有模型（比如5个）分别去预测它的总能量。由于这些模型初始权重不同，训练过程也有随机性，它们对一个“陌生”构型的预测结果可能会有差异。我们计算这5个预测值的标准差（σ_E）。这个标准差，就是模型对这个构型预测不确定性的代理指标。σ_E越大，说明委员会成员们对这个构型“意见分歧”越大，模型在这里可能没学好，这块区域正是我们需要补充训练数据的地方。

2.2.3 基于不确定性的数据选择与迭代ESTEEM采用了一种加权随机选择策略来挑选新的训练点：

为每个构型计算一个权重w_i = exp(5000 * σ_E_i)。这个指数函数放大了高不确定性构型的权重。
根据这个权重，进行加权随机采样，优先选中那些不确定性高的构型。
为了避免选中的构型在时间上过于接近（信息冗余），还会剔除掉与已选构型时间间隔太近（如10 fs内）的其他构型。
重复这个过程，直到选够预定数量的新构型（如100个），再将其分为训练集和验证集。
对这些新选中的构型，调用昂贵的TD-DFT进行高精度计算，获得新的“地面真值”数据。
将新数据加入原有数据集，从上一代模型权重开始进行微调训练，得到下一代MLIP。

如此循环2-4次。每一次循环，MLIP都在其最不确定、最需要学习的相空间区域获得了新的高精度数据，从而像滚雪球一样，越来越稳健，能够可靠采样的相空间范围也越来越广。

2.3 光谱生成：从能量轨迹到谱线

当经过多轮主动学习，我们获得了足够精确和稳健的MLIP后，就可以用它来执行“生产级”的长时间尺度模拟，用于最终的光谱预测。

2.3.1 长时间尺度采样与能量差计算

生产轨迹：从每个模型的委员会中选出一个代表性模型，进行长时间（如40 ps）的分子动力学模拟，充分采样平衡分布。
大尺寸团簇评估：为了获得收敛的光谱，我们需要评估比训练时更大的团簇（如R_carve = 5.0 Å甚至 7.5 Å）。用训练好的MLIP对这些大团簇进行快速评估，计算每个快照的基态和激发态能量。
能量差获取：获得每个快照的激发能（S1←S0能量差）有两种方式：
- 方式A（直接相减）：用激发态MLIP预测的能量减去基态MLIP预测的能量。
- 方式B（Δ-ML模型）：使用专门训练的“能量差模型”直接预测。这个模型以原子坐标为输入，直接输出基态与激发态的能量差、偶极矩差和受力差。这种方式避免了两个独立模型误差传递的问题。

2.3.2 从能量涨落到光谱线型：动态二阶累积量展开得到一长串随时间变化的激发能数据后，如何把它变成我们熟悉的、有峰有宽的吸收或发射光谱？这里用到了一个高级技巧：动态二阶累积量展开方法。

核心思想：光谱的线型和宽度，不仅取决于平均激发能（决定峰位），还强烈依赖于激发能围绕其平均值的涨落（决定峰宽和形状）。这种涨落来自于分子和溶剂环境的不断热运动（振动、转动、溶剂重组）。
DSCE方法：它通过处理激发能涨落的时间自相关函数，在Condon近似下，构建出一个近似的响应函数，再经过傅里叶变换得到光谱线型。这个方法能有效地从经典的MD轨迹中，提取出包含振动耦合效应的光谱特征，比简单的垂直激发能直方图（只能得到一个位置，没有形状）要物理得多。
实操细节：在ESTEEM中，这一步通常通过调用像MolSpecPy这样的专门库来完成。将MLIP预测出的能量差时间序列喂给DSCE算法，就能直接输出理论吸收或发射光谱。

3. 模型策略对比与性能深度剖析

ESTEEM工作流的一个强大之处在于其灵活性，它允许我们训练和比较不同类型的MLIP模型。文中对尼罗红体系系统比较了三种策略，结果非常具有启发性。

3.1 三种核心模型策略

单头单态模型：这是最直观的方式。训练两个独立的模型：一个专门预测基态（SH-GS）的性质（能量、受力），另一个专门预测第一激发态（SH-ES1）的性质。预测激发能时，就用SH-ES1的能量减去SH-GS的能量。
单头能量差模型：训练一个专门的模型（SH-EG），它的学习目标不是单个态的能量，而是两个态之间的差值（能量差、偶极矩差、受力差）。这个模型直接输出激发能。
多头模型：训练一个模型，但让它同时学习三个任务：预测基态性质、预测激发态性质、预测两者差值（MH-GS， MH-ES1， MH-EG）。三个任务共享底层原子特征表示，但各有独立的输出“头”。

3.2 关键发现与避坑指南

通过对尼罗红在三种溶剂中预测结果的细致分析，可以总结出以下几点至关重要的经验：

3.2.1 训练数据必须包含大尺寸溶剂团簇这是本文最关键的结论之一。模型集1（只用小尺寸溶液团簇和对应的小溶剂团簇训练）在预测小团簇（~3 Å）时表现尚可，但当用它来评估用于光谱预测的大团簇（5 Å）时，问题出现了：预测的激发能分布不随团簇尺寸收敛，光谱峰位随着R_carve增大而发生非物理的漂移。

根本原因：小团簇训练数据无法让模型学到长程的溶剂-溶剂相互作用。当评估大团簇时，模型需要处理大量它从未见过的、距离较远的溶剂分子对，其预测变得不可靠。更糟糕的是，基态模型和激发态模型在这种未知区域产生的误差很可能不一致，导致相减时误差无法抵消，甚至放大。
解决方案：在训练集中加入用更大R_carve（如5.0 Å）雕刻的纯溶剂团簇的基态数据（模型集2）。这相当于让模型在训练阶段就“见识”过溶剂分子在较大空间范围内的排列和相互作用。结果显示，这一举措极大地提升了大尺寸溶液团簇上能量预测的准确性，误差降低了34%以上，能量差预测误差更是降低了近90%。光谱预测也随团簇尺寸收敛了。

核心要点：MLIP的“外推”能力是有限的。如果你最终的应用目标是模拟大体系，那么训练数据就必须包含能体现大尺度相互作用的信息。单纯增加溶液团簇的尺寸成本太高（因为要做TD-DFT），而增加纯溶剂团簇的尺寸则便宜得多（只需做DFT），这是一个性价比极高的策略。

3.2.2 Δ-ML（能量差模型）显著优于直接相减比较模型集2中的SH-GS/SH-ES1相减法与SH-EG直接预测法，数据清晰地表明：专门训练的能量差模型（SH-EG）在预测激发能方面具有压倒性优势。

误差分析：对于尼罗红在乙腈中的大团簇测试集，SH-EG将能量差预测的平均绝对误差从直接相减的16.4 meV降低到了6.0 meV。在其他体系中也观察到类似的大幅提升。
原理：直接相减的方法，其误差来源于两个独立模型误差的叠加ΔE_error ≈ error_ES1 - error_GS。这个误差抵消是不可控的，可能好也可能坏。而SH-EG模型直接学习差值，它的优化目标就是最小化这个差值的误差，从根源上避免了误差传递问题。从光谱图上看，使用SH-EG模型预测的谱线，其峰位的标准差（委员会内不同模型预测的差异）也更小，说明模型预测更一致、更稳定。

3.2.3 多头模型的陷阱与架构限制模型集3的多头模型结果出人意料：尽管它共享特征提取层，理论上应该能学到更通用的原子表示，但其MH-EG头在预测大尺寸团簇的激发能时，表现反而不如独立的SH-EG模型。随着团簇半径增大，其预测误差增长更快，导致光谱峰位发生漂移。

问题诊断：作者推测，这可能源于模型容量不足。他们使用相同的MACE架构（32x0e+32x1o+32x2e）来同时学习三个任务，每个任务可能都未能获得足够的参数来充分捕捉其独特的复杂性。当任务之一（预测长程溶剂相互作用的能量差）变得困难时，共享的底层表示可能成为了瓶颈。
验证实验：为了验证这一点，他们训练了一个更大架构（64x0e+64x1o+64x2e）的MH模型。结果显示，这个更大模型在预测单个态能量方面的误差显著降低。这强烈暗示，对于复杂的多任务学习（尤其是包含能量差这种精细量），足够的模型容量和灵活性是成功的关键。如果计算资源允许，使用更大的多头模型或更先进的架构可能是更好的选择。

3.2.4 如何确定最优的团簇尺寸？最终用于光谱预测的团簇尺寸R_carve需要在精度和成本间权衡。文中通过系统测试给出了明确指南：

收敛性测试：逐渐增大用于预测光谱的团簇的R_carve，观察预测的谱峰位置和形状是否不再明显变化。对于尼罗红体系，在R_carve = 5.0 Å时，光谱基本收敛。
误差评估：同时评估模型预测的委员会内标准差。发现当R_carve从5.0 Å 增加到7.5 Å 时，预测峰位的标准差急剧增大（从±7 nm增至±15 nm），说明模型在此尺寸下的预测不确定性开始显著增加。
综合决策：因此，选择R_carve = 5.0 Å是一个合理的折中点。此时光谱已收敛，而模型的不确定性仍在可接受的低水平。这为类似溶液体系光谱模拟的团簇尺寸选择提供了宝贵的经验值。

4. 实战复盘：从理论光谱到实验趋势

经过上述复杂的流程，我们最终得到了MLIP预测的理论光谱。那么，它和实验符合得怎么样？

文中图3展示了尼罗红在三种溶剂中的实验光谱与基于模型集2（SH-EG）预测的理论光谱对比。我们需要理性地看待这个对比：

目标的一致性：首先明确，MLIP的训练目标是复现TD-DFT (PBE0)计算的势能面，而非真实的实验势能面。因此，理论光谱与实验光谱的绝对峰位差异，部分反映了TD-DFT方法本身的系统误差（如泛函近似）。
趋势的胜利：尽管绝对峰位有偏移，但ESTEEM工作流成功预测了关键的光谱学趋势：
- 斯托克斯位移：预测的发射光谱相对于吸收光谱的红移量，在三种溶剂中的变化趋势（环己烷 < 乙醇 < 乙腈）与实验一致。这反映了模型正确捕捉了溶剂极性增加对激发态稳定性的影响。
- 溶剂化变色效应：模型正确预测了尼罗红在环己烷中的光谱相对于在乙醇和乙腈中发生蓝移，且位移幅度相似。这说明模型学到了不同溶剂环境（非极性vs极性）对尼罗红电子结构的差异化影响。
振动结构的呈现：通过DSCE方法处理MLIP-MD轨迹得到的光谱，展现出了清晰的振动精细结构（肩峰），这与实验光谱中观察到的特征相符，比简单的垂直激发能直方图丰富得多。

项目心得：这个案例完美诠释了计算化学中“预测趋势重于绝对数值”的理念。通过ESTEEM自动化工作流结合MLIP，我们能够以可承受的计算成本，系统性地研究溶剂、温度、分子结构修饰等对光谱性质的影响规律，这对于指导荧光探针设计、理解光化学反应机理等具有巨大的实用价值。它把从前需要超级计算机算上数月的工作，变成了可能在几天内完成的自动化流程。

5. 常见问题与排查思路

在实际操作这套工作流时，你可能会遇到各种问题。以下是一些常见坑点及其排查思路：

5.1 MLIP-MD模拟崩溃或不稳定

症状：模拟过程中能量爆炸、原子飞散。
可能原因与解决：
1. 训练数据不足或代表性差：模型在采样的相空间区域没有见过类似构型。排查：检查主动学习循环是否充分，模型在崩溃构型附近的不确定性（σ_E）是否很高。如果是，需要增加主动学习迭代次数，或手动在该区域补充一些DFT计算点。
2. 力拟合不佳：第一阶段训练对力的权重不够。解决：增加第一阶段（侧重力拟合）的训练轮数，或调整损失函数中力项的权重。
3. MD参数问题：时间步长太大、温度控制不当。解决：使用更小的时间步长（如0.5 fs），确保使用合适的控温器（如Langevin），并给予足够的平衡时间。

5.2 预测光谱与实验偏差巨大，或趋势完全错误

症状：预测的峰位远离实验值，或溶剂化变色趋势相反。
可能原因与解决：
1. 底层电子结构方法不准：MLIP的精度上限取决于其训练数据（TD-DFT）的精度。排查：首先用少量构型，对比更高精度的方法（如CASPT2, CC2）或不同泛函的TD-DFT计算结果，确认你用的泛函/基组对该体系是可靠的。
2. 溶剂模型缺失：如果训练数据只用隐式溶剂或气相计算，模型完全学不到显式溶剂效应。解决：必须使用显式溶剂化的团簇进行DFT计算来生成训练数据。
3. 团簇尺寸未收敛：你用于最终光谱预测的团簇太小，没有包含完整的溶剂效应。解决：进行团簇尺寸收敛性测试（如本文所做），确保R_carve足够大。
4. 主动学习未覆盖关键区域：用于光谱采样的构型（如激发态动力学轨迹）可能进入了训练数据未曾覆盖的高能区域。解决：检查用于最终采样的MLIP-MD轨迹中的构型，用委员会模型评估其不确定性。如果σ_E很高，说明需要将这些新构型加入训练集进行新一轮主动学习。

5.3 训练过程缓慢或过拟合

症状：训练损失下降很慢，或验证损失很早就开始上升而训练损失持续下降。
可能原因与解决：
1. 模型架构或超参数不当：对于你的体系（原子种类、复杂度），模型可能太简单或太复杂。解决：尝试调整MACE模型的通道数、交互层数等。可以从较小模型开始，逐步增加复杂度。使用学习率调度和早停策略。
2. 数据噪声或不一致性：DFT计算本身因收敛标准、积分网格等问题存在微小噪声。排查：检查训练数据中能量和力的自洽性。确保所有DFT计算使用完全相同的设置。
3. 数据量太少：对于复杂溶液体系，可能需要数千甚至上万个训练构型。解决：耐心进行多轮主动学习，逐步积累数据。确保主动学习策略能有效探索相空间。

5.4 Δ-ML模型训练失败

症状：SH-EG模型的误差反而比直接相减还大。
可能原因与解决：
1. 能量差数据噪声大：如果基态和激发态DFT计算本身的误差就很大且不相关，那么能量差这个目标量的噪声会被放大。排查：检查DFT计算是否充分收敛（能量、梯度、SCF）。考虑使用更稳健的数值方法计算能量差（如使用完全相同的基组和积分网格进行两个态的单点计算）。
2. 模型容量不足：能量差是一个相对精细的量。解决：尝试为SH-EG模型使用比单态模型更大的架构（更多参数）。
3. 训练策略问题：直接训练能量差模型可能需要对损失函数进行特殊设计，例如对能量差、偶极矩差和受力差给予不同的权重。需要根据具体任务进行调整。

这套基于MLIP和主动学习的自动化光谱预测工作流，代表了计算化学从“手工单点计算”向“智能高通量模拟”演进的方向。它把研究人员的精力从重复繁琐的计算任务中解放出来，更多地投入到科学问题的设计、结果的分析和机理解释上。虽然上手有一定门槛，但一旦流程打通，其效率和系统性是传统方法无法比拟的。

查看全文

http://www.jsqmd.com/news/882148/