当前位置：首页 > news >正文

RBM动态构建量子化学紧凑Ansatz：机器学习赋能NISQ计算

news 2026/7/13 5:42:15

1. 项目概述：当机器学习遇见量子化学计算

在量子计算领域，尤其是针对近期嘈杂中等规模量子（NISQ）设备，一个核心的挑战是如何设计出既高效又精确的量子线路（Ansatz）来求解复杂的化学问题，比如分子的基态能量。传统的全配置相互作用（FCI）方法虽然精确，但其所需的量子资源随系统规模呈指数级增长，在当前的硬件条件下完全不现实。因此，变分量子算法，如变分量子本征求解器（VQE），成为了主流方案。它们通过优化一个参数化的量子线路来寻找系统哈密顿量的基态，其成败很大程度上取决于Ansatz的设计是否巧妙。

一个好的Ansatz需要在“表达能力”（能多好地近似真实波函数）和“可执行性”（线路深度、参数数量是否适合NISQ设备）之间取得精妙的平衡。近年来，一个引人注目的思路是将经典机器学习，特别是生成式模型，引入到Ansatz的构建过程中。这并非要用机器学习直接替代量子计算，而是让机器学习充当一个“智能设计师”，从有限的量子测量数据中学习电子关联的模式，并指导我们构建出更紧凑、更高效的量子线路。我们今天要深入探讨的，正是这样一个前沿的交叉领域工作：利用受限玻尔兹曼机（RBM）这一生成式模型，结合多体微扰理论，动态构建化学启发的紧凑Ansatz。

简单来说，这项工作的核心价值在于：它找到了一种方法，让RBM从容易获取的低秩激发（如单、双激发）数据中“学会”猜测哪些高秩激发（如三激发）是重要的。然后，它并非笨拙地将这些高秩算符直接塞进线路（那会急剧增加门深度），而是巧妙地将其分解成已有的低秩算符的组合，从而在几乎不增加线路复杂度的前提下，显著提升了计算精度。这就像一位经验丰富的建筑师，不是盲目增加建材，而是通过优化结构设计，用更少的材料盖出更稳固的房子。

2. 核心原理与方案设计思路拆解

要理解这个方案，我们需要拆解几个关键部分：为什么是RBM？什么是“动态Ansatz构建”？以及如何将高秩算符“压缩”进浅层线路？

2.1 受限玻尔兹曼机：量子态的“模式识别器”

受限玻尔兹曼机是一种两层的生成式随机神经网络，包含一个可见层和一个隐藏层。在量子态表示的语境下，我们可以这样类比：

可见层：对应量子比特的测量结果。每个可见节点代表一个量子比特在计算基下的状态（0或1）。因此，一个特定的可见层向量配置（比如[1,0,1,1,0,...]）就唯一对应一个多体行列式（Slater行列式），也就是波函数在某个基矢上的分量。
隐藏层：这是模型的关键。隐藏节点没有直接的物理对应，它们的作用是捕捉可见层数据（即各个行列式）之间复杂的、高维的关联模式。你可以把它想象成一个“关联特征提取器”。
训练目标：给定一组来自某个近似波函数（比如dUCCSD Ansatz得到的态）的测量数据，RBM通过调整连接权重和偏置，学习这些数据出现的概率分布。训练完成后，这个RBM就编码了该近似波函数中低秩激发行列式之间的关联信息。

RBM的生成能力正源于此：当它学会了低秩激发的模式后，可以通过采样，生成新的、训练数据中未曾出现过的二进制向量。这些新向量，就对应着可能对真实基态有重要贡献的、更高秩的激发行列式。这本质上是利用模型从“已知”到“未知”的泛化能力。

2.2 动态Ansatz构建：从“学习”到“搭建”

传统构建Ansatz的方法往往是静态的、基于化学直觉的（比如固定使用UCCSD）。而“动态构建”指的是根据具体分子系统的特性，自动地、数据驱动地生成最适合该系统的Ansatz结构。本方案的动态构建流程可以概括为以下四个核心步骤，它们形成了一个从量子设备到经典模型再回到量子设备的闭环：

生成近似波函数与数据采集：首先，在量子设备（或模拟器）上运行一个基础的浅层Ansatz，比如经过微扰理论筛选的dUCCSD，通过VQE优化得到近似波函数|Ψ_SD⟩。然后，对这个态进行大量计算基测量，统计各个单、双激发行列式出现的概率。这些（行列式，概率）对就构成了RBM的训练数据集。这一步是唯一需要大量量子测量的阶段。
RBM训练与高秩激发预测：用上一步得到的数据集训练一个RBM模型。训练完成后，利用这个RBM进行吉布斯采样，生成一大批新的行列式。从这些生成的行列式中，筛选出比训练集秩高一阶的行列式（例如，如果训练集是单双激发，则筛选三激发行列式）。
算符分解与二次筛选：这是实现“浅深度”的关键。直接将这些高秩激发算符（如三激发算符κ^abc_ijk）加入Ansatz会引入大量量子门。本方案采用了一个巧妙的分解技巧：将每个高秩算符分解为一个“散射子”算符与一个已有的低秩算符的对易子。例如，κ^abc_ijk可以分解为[σ^al_ij, κ^bc_lk]。这里κ^bc_lk是一个已经在初始dUCCSD Ansatz中的双激发算符，而σ^al_ij是一个有效的双体算符（散射子）。通过这种分解，高秩激发效应被“编码”进由低秩算符构成的浅层线路中。分解后，还会利用微扰理论（如MP2振幅）对散射子进行二次筛选，只保留贡献最大的部分，进一步压缩Ansatz。
构建并优化最终Ansatz：将筛选后的散射子算符，以对易子的形式与对应的低秩算符结合，插入到初始Ansatz的适当位置，形成最终的RBM1s-dUCCAnsatz（例如RBM1s-dUCCSDTS，其中T表示三激发，S表示通过散射子分解引入）。最后，再次使用VQE对这个新的、更强大的Ansatz进行参数优化，得到更精确的基态能量。

这个方案的巧妙之处在于，它让RBM承担了最困难的“模式识别”和“候选生成”工作，而用量子硬件擅长的酉演化来精确表达波函数。同时，通过算符分解，它避免了生成式模型直接输出复杂量子线路的困难，将问题转化为了可管理的量子线路合成问题。

2.3 与相关方法的对比思考

你可能听说过其他结合机器学习和量子计算的方法，比如神经量子态层析（NQST）。NQST的目标是直接用神经网络（如两个RBM）来完整表示一个量子态的振幅和相位。这与本方案有本质区别：

目标不同：NQST旨在完全替代量子态，是“表征”问题。而本方案中，RBM仅用于辅助“设计”量子线路，最终的态仍然由量子硬件通过酉演化产生。
优势：本方案避免了用经典模型直接模拟量子态时面临的维度灾难问题，特别是对于纠缠度高的态。它结合了经典机器学习的模式识别能力和量子计算的本质并行性，更适合在NISQ设备上实现有实用价值的量子化学计算。

3. 实操要点与核心环节深度解析

理解了宏观思路，我们深入到具体实施的细节和关键选择背后“为什么”。

3.1 初始近似波函数的选择：为什么是dUCCSD？

选择使用dUCCSD作为生成训练数据的初始Ansatz，是基于多重考虑的：

基础足够好：在多数化学系统中，单双激发提供了电子关联最主要的贡献（通常超过95%）。这意味着从|Ψ_SD⟩中采样得到的数据，已经包含了描述该系统电子行为最核心的模式。RBM从这个“高质量”的数据集学习，更容易提取出有��的规律来预测更高阶的关联。
线路深度可控：dUCCSD本身是纠缠型UCCSD的一种近似，通过将指数上的算符和分解为多个浅层指数算符的乘积，显著降低了量子线路深度，使其易于在NISQ设备上执行。
与微扰理论的自然衔接：方案中使用了MP2振幅来对双激发算符进行初步筛选（例如，只保留振幅大于10^-5的算符）。MP2本身就是基于Hartree-Fock参考态的双激发微扰修正，其振幅大小可以粗略指示该激发通道的重要性。这为构建一个更紧凑的初始dUCCSD提供了直观的物理依据。

注意：MP2筛选的阈值（如10^-5）是一个经验参数。在强关联体系中，低阶微扰理论可能失效。作者指出，他们选择的保守阈值在实践中表现稳健。但对于全新的、高度关联的体系，可能需要谨慎验证或调整此阈值。

3.2 RBM超参数优化：贝叶斯方法的价值

RBM的性能高度依赖于几个关键超参数：隐藏层节点数、学习率、批大小和吉布斯采样的步数。传统网格搜索或随机搜索在调参上效率低下。

隐藏层节点数：这决定了模型的容量。太少，无法捕捉复杂模式；太多，容易过拟合训练数据（即只记住数据而不会泛化）。文中发现，最优隐藏节点数大约是可见节点数（即量子比特数）的一个倍数。
吉布斯采样步数：控制生成样本的质量。步数太少，生成的数据是“半成品”，不能代表模型学到的分布；步数太多，生成的数据会过于接近训练数据本身，缺乏对新行列式的探索。
为什么用贝叶斯优化（如TPE）？贝叶斯优化构建了超参数与模型性能（如生成行列式的质量）之间的概率代理模型，通过智能地选择下一个待评估的点，能用远比网格搜索少的尝试次数找到接近最优的组合。这对于计算成本高昂的量子-经典混合流程至关重要，因为它最小化了为了调参而重复运行量子实验或模拟的次数。

实操心得：在实际操作中，可以选取一个中等大小、具有代表性的分子体系（如文中选择的特定构型的CH2分子）进行一轮细致的贝叶斯超参数优化。一旦找到一组表现良好的参数，可以将其“迁移”到同系列或性质类似的其他分子计算中，通常能获得不错的结果，这避免了为每个体系都重复调参的巨大开销。

3.3 核心技巧：高秩算符的低秩分解

这是整个方案能实现“浅深度”的灵魂所在。我们详细拆解一下：

直接实现的代价：一个K体激发算符（如三激发K=3）经过Jordan-Wigner变换后，产生的泡利项数量级约为O(2^{2K-1})。对于三激发，直接实现需要约32个泡利串，对应数十个量子门。
分解策略：方案将高秩算符κ_high分解为两个低秩算符的对易子：κ_high ≈ [σ, κ_low]。其中κ_low是一个已经存在于当前Ansatz中的低秩算符（例如一个双激发算符），σ是一个被称为“散射子”的有效双体算符。散射子本身也具有较低的激发秩（空穴-粒子激发秩为1）。
门数量缩减：两个双体算符各自约需8个泡利串。因此，实现这个对易子结构大约需要16个泡利串。相比直接实现三激发，门数量减半。更重要的是，这种分解允许我们将高秩关联效应“编织”进一个由现有低秩算符构成的框架中，无需引入全新且复杂的量子门模块。
物理图像：你可以这样理解：κ_low产生一个基础的激发，而σ像一个“修饰符”或“散射过程”，作用在κ_low上，共同等效地产生了一个更高阶的激发。这类似于耦合簇理论中的因子化波函数思想。

注意事项：分解不是唯一的。同一个高秩算符可能通过不同的κ_low和σ组合来实现。方案中采用了一个择优策略：当多个分解路径对应的高秩算符相同时，选择其中MP2振幅绝对值最大的那个散射子σ。这保证了纳入的是最主导的贡献通道。

3.4 测量成本与采样策略分析

整个流程中，测量成本主要集中在第一步：获取训练数据。需要测量dUCCSD产生的态|Ψ_SD⟩在计算基下的概率分布。

采样空间：理论上，一个n-qubit的态需要2^n次测量才能完全确定其概率分布。但这在实践中不可能。幸运的是，|Ψ_SD⟩是一个相对紧凑的态，其概率质量主要集中在与单双激发对应的那些行列式上。因此，我们可以通过合理数量的采样来近似这个分布。
采样数设定：文中使用了10000个样本进行训练。这个数字远小于完全层析所需，也少于一些早期方法（参考文献17中用了50万）。这得益于RBM作为生成模型的数据效率——它可以从相对稀疏的数据中学习分布特征。
后续无测量：一旦RBM训练完成，后续的生成、筛选、分解、构建新Ansatz等步骤完全在经典计算机上完成。只有最后对新Ansatz进行VQE优化时，才需要重新开始量子测量来估计能量期望值。这实现了测量成本的“前端集中”，避免了在迭代构建过程中反复调用昂贵的量子测量。

4. 实现流程与参数优化实战指南

让我们以一个假想的双原子分子（例如LiH）在STO-3G基组下的计算为例，串联起整个实操过程。

4.1 环境准备与初始计算

首先，在经典端完成前期工作：

获取积分：使用量子化学软件（如PySCF）对目标分子进行Hartree-Fock计算，冻结芯轨道，获得分子轨道、单双电子积分以及MP2振幅。
构建哈密顿量：将第二量子化形式的电子哈密顿量，通过Jordan-Wigner变换映射到量子比特哈密顿量（一系列泡利算符的加权和）。
设计初始dUCCSD Ansatz：
- 列出所有可能的单激发和双激发算符。
- 根据MP2振幅绝对值进行筛选，例如，丢弃所有|MP2| < 10^-5的双激发算符。单激发通常全部保留。
- 将筛选后的激发算符按MP2振幅绝对值降序排列，构建dUCCSD线路。注意，双激发算符部分在前，单激发在后。

4.2 量子-经典混合循环：步骤详解

步骤一：运行VQE获取训练数据在量子模拟器或真机上，执行以下操作：

# 伪代码示意 from qiskit import Aer, QuantumCircuit, execute from qiskit.algorithms.optimizers import COBYLA from qiskit.algorithms import VQE # ... 初始化哈密顿量 ham， 构建参数化的 dUCCSD 线路 ansatz_sd ... vqe = VQE(ansatz=ansatz_sd, optimizer=COBYLA(maxiter=500), quantum_instance=quantum_instance) result = vqe.compute_minimum_eigenvalue(ham) optimal_params = result.optimal_parameters # 使用最优参数制备态 |Psi_SD> qc_with_opt_params = ansatz_sd.assign_parameters(optimal_params) # 对该态进行大量计算基测量 counts = execute(qc_with_opt_params, backend, shots=10000).result().get_counts()

得到的counts是一个字典，键是二进制字符串（如‘010110’），值是出现次数。将其转换为概率，并过滤出只对应单、双激发的那些比特串（需要根据激发算符的定义进行映射）。这些（比特串，概率）对就是RBM的训练数据。

步骤二：训练RBM在经典端，使用Scikit-learn等库训练RBM：

from sklearn.neural_network import BernoulliRBM import numpy as np # 准备数据：将二进制字符串转换为二维数组，每行是一个样本，每列是一个可见节点（量子比特） # data_matrix 形状为 (n_samples, n_qubits) # 使用之前贝叶斯优化得到的超参数 rbm = BernoulliRBM(n_components=23, # 隐藏节点数 learning_rate=0.00198459, batch_size=90, n_iter=1000, # 训练迭代次数 random_state=42) rbm.fit(data_matrix)

步骤三：生成与筛选高秩激发

吉布斯采样：使用训练好的RBM进行吉布斯采样，生成大量新的二进制样本（例如10000个）。
解码与筛选：将这些二进制样本解码回对应的激发行列式。识别出其中所有“三激发”行列式（即与参考态相比，有3个电子被激发到虚轨道的行列式）。
去重与频次过滤：统计每个独特的三激发行列式在生成样本中出现的次数。只保留出现次数超过一定阈值（例如 > 1次）的行列式，认为它们是RBM预测的“重要”三激发。

步骤四：构建RBM1s-dUCCSDTS Ansatz这是最需要化学编程知识的一步：

算符分解：对于每一个筛选出的三激发行列式，找到其对应的激发算符κ_T。然后，寻找所有可能的分解方式κ_T = [σ, κ_D]，其中κ_D是初始dUCCSD中已有的某个双激发算符。
散射子筛选：计算每个分解中散射子σ对应的MP2振幅（这需要从最初的积分信息中获取）。只保留|MP2(σ)| > 10^-5的分解。
唯一性处理：如果同一个κ_T可以通过多个κ_D和不同的σ分解得到，则选择|MP2(σ)|最大的那条路径。
线路构建：将筛选后的散射子算符σ，以exp(θ_σ * σ)的形式，插入到Ansatz中其对应的双激发算符exp(θ_D * κ_D)之后。整个线路的顺序保持不变：处理过的双激发部分 -> 未参与分解的双激发部分 -> 单激发部分。这就构成了RBM1s-dUCCSDTSAnsatz。

4.3 最终优化与初始点选择

使用VQE优化新构建的RBM1s-dUCCSDTSAnsatz。

初始参数设置：这是影响优化效率和结果的关键。方案强烈推荐两种方式：
1. 零初始化：所有新参数（包括原有的和新加的散射子参数）均从0开始。
2. MP2初始化：原有的单、双激发参数用其MP2振幅初始化，新加的散射子参数从0开始。
避免随机初始化：如图2所示，对于这类紧凑的、物理启发的Ansatz，随机初始化参数极易使优化陷入糟糕的局部极小值或 barren plateau（贫瘠高原）区域，导致优化失败。而零或MP2初始化提供了一个靠近真实解的良好起点。
优化器选择：文中使用了共轭梯度法（CG）。在实际中，对于参数较多的Ansatz，像COBYLA、SPSA这类噪声鲁棒的优化器可能更适用于含噪的量子硬件。

5. 常见问题、性能分析与扩展讨论

5.1 方案性能与成本分析

为了更直观地对比，我们将关键步骤的成本总结如下：

步骤	主要操作	计算复杂度/成本关键点	备注
1. 初始VQE	优化dUCCSD	量子门数: ~O(n^4) - O(n^5)	通过MP2筛选可大幅减少双激发算符数量。
2. 数据测量	采样 `	Ψ_SD⟩`	测量次数: O(1/ε^2) * #PauliTerms
3. RBM训练	经典机器学习训练	时间: ~O(n_qubits^2)	在经典计算机上完成，效率高。
4. 生成与分解	吉布斯采样、算符分解	经典计算，与生成的行列式数量相关	筛选策略保证了只处理主导的高秩激发，数量可控。
5. 最终VQE	优化RBM1s-dUCC	量子门数: 略高于步骤1，但远低于直接实现高秩激发。	因分解引入额外散射子，深度略有增加，但属线性增长。

核心优势：

测量效率：量子测量仅集中在初始数据采集阶段，避免了在Ansatz探索循环中反复测量。
线路深度：通过算符分解，以近似线性增加的门数代价，引入了高阶关联效应，避免了指数级增长。
自动化：减少了构建Ansatz对特定领域专家直觉的依赖，实现了数据驱动的动态构建。

5.2 潜在问题与排查思路

RBM生成质量不高，未能预测出重要的高秩激发
- 检查训练数据：确认初始dUCCSD优化是否收敛到了一个合理的态。如果|Ψ_SD⟩本身质量很差，RBM无法学到有效模式。
- 调整超参数：隐藏节点数可能不足，或吉布斯采样步数太少。考虑用更小的分子重新进行贝叶斯优化。
- 增加采样量：尝试增加生成样本的数量（如从1万增至5万），以获得更全面的高秩激发候选集。
最终VQE优化不收敛或收敛到高能量
- 验证初始点：务必确保参数是从零或MP2值开始初始化。这是最常见的问题。随机初始化几乎必然失败。
- 检查Ansatz结构：确认算符分解和插入的逻辑正确，没有破坏线路的酉性。可以先用经典模拟计算新Ansatz在初始点附近的能量梯度，看是否合理。
- 优化器与迭代次数：尝试更换优化器，或增加最大迭代次数。对于复杂Ansatz，可能需要更多迭代才能收敛。
对于强关联体系，精度提升有限
- 物理限制：该方法的基础是dUCCSD能捕获“定性正确”的关联。对于强关联体系（如过渡金属化合物、键解离区域），dUCCSD本身可能已不适用，导致训练数据失效。此时需要考虑使用更强大的初始Ansatz或参考态。
- 递归应用：本方案（RBM1s）只引入下一阶激发（如三激发）。对于需要四激发、五激发贡献的体系，可以递归应用此流程：以优化后的RBM1s-dUCCSDTS态作为新的训练数据，让RBM预测四激发，并进一步分解为两个散射子与双激发算符的对易子。

5.3 扩展与未来方向

这项工作的框架具有很强的可扩展性：

与其他初始Ansatz结合：不一定非要从dUCCSD开始。任何能产生高质量低秩近似波函数的浅层量子线路，如量子拟设变分量子本征求解器（ADAPT-VQE）的早期迭代，都可以作为训练数据的来源。
集成更先进的VQE技术：最终的能量优化可以结合测量减少、误差缓解等更先进的VQE技术，以进一步提升在真实NISQ硬件上的表现。
探索其他生成模型：除了RBM，可以尝试变分自编码器（VAE）、生成对抗网络（GAN）等更现代的生成模型，看是否能以更少的数据或更快的速度学习波函数模式。

这项研究为我们展示了一条清晰的路径：通过精心设计的经典-量子混合架构，让机器学习承担起“量子线路设计师”的角色，从而释放NISQ设备在解决实用化学问题上的潜力。它不仅仅是两个领域的简单叠加，而是通过算符分解等关键技巧，实现了“1+1>2”的协同效应。在实际操作中，保持对初始参数设置的警惕，并深入理解每一步背后的物理图像，是成功复现和应用该方法的关键。

查看全文

http://www.jsqmd.com/news/886465/