当前位置：首页 > news >正文

基于QUBO模型与迭代学习的蛋白质序列设计方法详解

news 2026/5/24 9:02:21

1. 项目概述：当蛋白质设计遇上组合优化

在计算生物学和药物研发领域，蛋白质设计一直被视为“圣杯”级的挑战。其核心目标是从天文数字般的可能氨基酸序列中，找到那些能够折叠成特定三维结构并执行预定功能的序列。传统方法，无论是基于物理力场的模拟还是基于经验的规则，都难以应对序列空间随链长指数级增长的组合爆炸问题。这就像是在一个由20种字母（标准氨基酸）构成的、长度超过100个字符的“单词库”里，寻找唯一能拼出特定立体形状的单词，其难度可想而知。

近年来，一个看似不相关的领域——组合优化，特别是二次无约束二进制优化模型，为破解这一难题提供了全新的视角。QUBO模型以其数学上的优雅和通用性，成为描述众多NP难问题的统一框架。它的技术魅力在于，任何可以转化为“在二进制变量集合上最小化一个二次多项式”的问题，理论上都可以用同一套优化引擎来求解。这为蛋白质设计这类本质上是离散组合选择的问题，提供了一个绝佳的数学表述形式。

更令人兴奋的是，QUBO模型恰好是量子退火器等新兴计算硬件天然“理解”的语言。这使得我们能够将蛋白质序列设计问题，直接映射到量子或量子启发式计算设备上进行求解，从而有可能触及经典计算机无法有效探索的解决方案空间。本文要探讨的，正是这样一个前沿的交叉点：如何构建一个迭代框架，将蛋白质结构预测的机器学习模型、用于序列优化的QUBO模型，以及经典/量子优化器三者融合，实现高效、自动化的蛋白质设计。我们不仅会拆解其核心原理，还会深入实操细节，分享在实现过程中遇到的“坑”与应对技巧。

2. 核心思路拆解：一个迭代学习的闭环系统

这个项目的核心创新并非简单地用优化器去搜索序列，而是构建了一个**“预测-设计-验证-学习”**的闭环系统。其整体工作流程可以概括为以下四个步骤，它们循环迭代，逐步精化设计规则：

初始化与目标设定：首先，我们需要一个目标蛋白质的三维结构（靶标结构），以及一个初始的、猜测的氨基酸相互作用能量矩阵。同时，确定序列的氨基酸组成（即每种氨基酸各用多少个）。
序列优化（设计步骤）：基于当前的能量矩阵和靶标结构的接触图，将“找到最可能折叠到靶标结构的序列”这一目标，形式化为一个QUBO问题。随后，调用优化器（如模拟退火、GUROBI或D-Wave混合求解器）来求解这个QUBO问题，得到一批候选序列。
折叠验证（预测步骤）：使用一个可靠的蛋白质结构预测模型（在概念验证中，为了消除预测不确定性，他们甚至采用了穷举枚举所有可能构象的严格方法），去评估上一步得到的每个候选序列。计算每个序列的最低能量构象（即最稳定的结构），并检查它是否与靶标结构一致。
能量矩阵更新（学习步骤）：这是算法的“智能”所在。将上一步验证的结果作为训练数据：那些成功折叠到靶标结构的序列被标记为“好”样本，其靶标构象的能量应低于其他任何构象；那些折叠到错误结构的序列则提供“坏”的对比样本。利用这些数据，通过一种分类算法（如文中采用的感知机方法）来更新能量矩阵的参数，使得新的能量矩阵能更好地区分“好”与“坏”的序列-结构配对。
迭代循环：用更新后的能量矩阵，回到第2步，开始新一轮的序列优化。如此循环，能量矩阵会越来越准确地反映真实的折叠偏好，从而引导优化器找到更高质量的设计序列。

这个框架的巧妙之处在于，它不依赖于任何预设的、可能不准确的物理力场参数。能量矩阵是通过算法从数据中“学”出来的，学习的目标就是让预测模型（折叠验证器）认为设计出的序列会稳定在目标结构上。这相当于让优化器和预测器互相训练，共同逼近一个理想的设计规则。

2.1 为什么选择QUBO模型？

将序列设计转化为QUBO问题是整个流程的关键。QUBO的标准形式是最小化目标函数：H = Σᵢⱼ Qᵢⱼ xᵢ xⱼ，其中xᵢ是二进制变量（0或1），Qᵢⱼ是问题相关的系数矩阵。

在蛋白质设计场景中：

二进制变量xᵢ：我们需要为蛋白质链上的每个位置i，以及氨基酸类型a，定义一个二进制变量qᵢᵃ。如果位置i上是氨基酸类型a，则qᵢᵃ = 1，否则为0。
目标函数：设计评分函数G(S)的核心是评估序列S在靶标结构Γ₀上的“适配度”。一个自然的想法是，如果序列S的氨基酸在靶标结构的接触点对上具有有利的相互作用，那么G(S)就应该小。因此，G(S)可以构建为Σᵢⱼ Cᵢⱼ(Γ₀) * ε_{sᵢ, sⱼ}，其中Cᵢⱼ是接触矩阵（如果位置i和j在结构Γ₀中接触则为1，否则为0），ε_{a,b}是待学习的氨基酸a和b之间的相互作用能量。这个求和本质上是一个二次型。
约束条件编码：序列设计有两个硬约束：1）每个位置只能有一种氨基酸（排他性）；2）整个序列必须满足预设的氨基酸组成。这些约束无法直接放入目标函数，但可以通过惩罚项的方式整合进QUBO模型。例如，对于每个位置i，添加惩罚项A₁ * (Σₐ qᵢᵃ - 1)²，这保证了当且仅当有一个qᵢᵃ为1时，该项为0。类似地，对于每种氨基酸a，添加惩罚项A₂ * (Σᵢ qᵢᵃ - Nₐ)²，以确保其出现次数正好为Nₐ。

通过将目标函数和约束惩罚项相加，我们就得到了一个完整的QUBO哈密顿量H。最小化H，就是在满足所有序列约束的前提下，寻找使序列与靶标结构相互作用最优的解。

实操心得：约束权重的选择惩罚项系数A₁和A₂的选择至关重要。如果太小，约束可能被违反，产生无效序列（如一个位置有多种氨基酸）；如果太大，则优化过程会过度关注满足约束，而忽略了优化相互作用的原始目标。文中提到他们设置A₁ = A₂ = 2.1,B=1（B是目标函数的缩放因子）。这是一个经验值。在实际操作中，建议从一个量级开始（如令A是目标函数中典型相互作用能量绝对值的5-10倍），然后根据优化器输出中约束违反的情况进行微调。可以编写一个后处理脚本来统计无效解的比例，动态调整A值。

3. 从问题到QUBO：编码细节与实现要点

理解了核心思路后，我们深入看看如何具体地将一个蛋白质设计问题“编码”成QUBO求解器能理解的格式。这是连接生物学问题与计算框架的桥梁。

3.1 变量编码与维度爆炸

对于一个长度为N、氨基酸字母表大小为D的蛋白质设计问题，最直接的编码方式是使用N * D个二进制变量。这意味着一个仅有50个氨基酸、考虑20种标准氨基酸的问题，就需要1000个变量。QUBO问题的系数矩阵Q的大小是变量数的平方，即100万（10^6）个元素。虽然稀疏，但规模已经相当可观。

原文附录S1中介绍了一种更经济的编码方式。由于每个位置必须且只能有一种氨基酸，所有D个变量qᵢ¹, qᵢ², ..., qᵢᴰ的和必须为1。利用这个关系，我们可以用D-1个变量来表示一个位置的状态。例如，令qᵢ¹ = 1 - Σ_{a=2}^D qᵢᵃ。这样，变量总数减少到N * (D-1)。虽然只减少了N个变量，但在处理大规模问题时，每一个变量的减少都对降低计算复杂度至关重要，尤其是在量子退火器这种量子比特资源极其珍贵的硬件上。

3.2 目标函数与约束的矩阵构建

构建QUBO矩阵Q是一个系统性的过程。假设我们采用经济编码，变量索引为(i, a)，其中i是位置（1到N），a是氨基酸类型（2到D）。

目标函数项：来自G(S) = Σᵢⱼ Cᵢⱼ * ε_{sᵢ, sⱼ}。经过展开和代入经济编码关系（详见原文公式20），每一项ε_{sᵢ, sⱼ}会转化为关于变量qᵢᵃ和qⱼᵇ的二次项系数，以及关于单个变量qᵢᵃ的一次项系数（在QUBO中，一次项xᵢ可以看作xᵢ * xᵢ，因为xᵢ是0或1）。我们需要仔细地将这些系数累加到Q矩阵的对应位置Q[(i,a), (j,b)]和Q[(i,a), (i,a)]上。
约束惩罚项：
- 单位置约束：Σₐ qᵢᵃ = 1等价于(Σₐ qᵢᵃ - 1)² = 0。展开后得到Σₐ qᵢᵃ² + Σ_{a≠b} qᵢᵃ qᵢᵇ - 2Σₐ qᵢᵃ + 1。由于qᵢᵃ² = qᵢᵃ，这贡献了对角线项(1 - 2A₁) * qᵢᵃ和非对角线耦合项A₁ * qᵢᵃ qᵢᵇ。
- 全局组成约束：Σᵢ qᵢᵃ = Nₐ等价于(Σᵢ qᵢᵃ - Nₐ)² = 0。展开后得到Σᵢ qᵢᵃ² + Σ_{i≠j} qᵢᵃ qⱼᵃ - 2Nₐ Σᵢ qᵢᵃ + Nₐ²。这贡献了对角线项和不同位置间相同氨基酸类型变量的耦合项。

将所有项的系数按变量索引累加，就得到了最终的、对称的Q矩阵。

# 伪代码示例：构建QUBO矩阵（简化版，未包含经济编码） import numpy as np def build_qubo_matrix(N, D, contact_map_C, energy_matrix_epsilon, A1, A2, composition_N): """ N: 蛋白质长度 D: 氨基酸字母表大小 contact_map_C: N x N 矩阵，靶标结构的接触图 energy_matrix_epsilon: D x D 矩阵，氨基酸相互作用能量 A1, A2: 约束惩罚权重 composition_N: 长度为D的列表，每种氨基酸的预设数量 """ num_vars = N * D Q = np.zeros((num_vars, num_vars)) # 辅助函数：将 (位置i, 氨基酸类型a) 映射到变量索引 def var_index(i, a): return (i-1) * D + (a-1) # 假设索引从1开始 # 1. 构建目标函数项 (简化G(S)展开) for i in range(N): for j in range(i+1, N): # 上三角，避免重复 if contact_map_C[i, j] != 0: # 如果i,j接触 for a in range(D): for b in range(D): idx_i_a = var_index(i, a) idx_j_b = var_index(j, b) coeff = contact_map_C[i, j] * energy_matrix_epsilon[a, b] Q[idx_i_a, idx_j_b] += coeff # 2. 构建单位置约束惩罚项 (每个位置只能选一种氨基酸) for i in range(N): for a in range(D): idx_a = var_index(i, a) # 对角线项来自 q^2 = q Q[idx_a, idx_a] += A1 * (1 - 2) # 来自 (Σq -1)^2 展开的 -2q 部分和 q^2=q for b in range(a+1, D): idx_b = var_index(i, b) # 非对角线耦合项 Q[idx_a, idx_b] += 2 * A1 # 因为Q矩阵最终会取上三角，所以加2倍 # 3. 构建全局组成约束惩罚项 (每种氨基酸总数固定) for a in range(D): target_count = composition_N[a] # 收集所有代表氨基酸a的变量索引 var_indices_a = [var_index(i, a) for i in range(N)] for idx in var_indices_a: Q[idx, idx] += A2 * (1 - 2*target_count) # 来自 (Σq - N)^2 # 添加相同氨基酸类型在不同位置间的耦合 for i in range(len(var_indices_a)): for j in range(i+1, len(var_indices_a)): idx_i = var_indices_a[i] idx_j = var_indices_a[j] Q[idx_i, idx_j] += 2 * A2 # 使矩阵对称（通常QUBO求解器要求上三角矩阵，但构建对称矩阵更直观） Q = (Q + Q.T) / 2 # 注意：对角线元素不应重复加倍，上述构建已直接处理对角线 return Q

注意事项：系数累加与符号在累加系数时，务必注意符号。我们的目标是最小化H。因此，有利的相互作用（负能量，ε_{a,b}为负）应该产生负的系数，鼓励相应的qᵢᵃ和qⱼᵇ同时为1。约束惩罚项总是正的，因为违反约束会增加能量（成本）。在实现时，建议先小规模测试（如N=3，D=2），手动计算几个序列的H值，与你的代码输出对比，确保矩阵构建正确。

4. 优化器实战：从模拟退火到量子混合求解

QUBO模型搭建好后，下一步就是调用优化器求解。原文对比了三种方法：经典模拟退火、商业整数规划求解器GUROBI、以及D-Wave的混合量子退火求解器。我们逐一解析其应用和背后的考量。

4.1 经典模拟退火：灵活性与定制化

模拟退火是启发式全局优化的经典算法。在这个项目中，作者并未直接求解QUBO形式的SA，而是采用了一种序列空间的直接采样方法，这本身就是一个重要的实操技巧。

具体操作：

表示：序列直接用氨基酸字母的数组表示，如[A, R, V, D, ...]，而不是二进制变量。
初始状态：随机生成一个满足预设氨基酸组成的序列。
移动提案：随机选择序列中的两个位置，交换它们的氨基酸。这一步的精妙之处在于，交换操作天然保持了氨基酸组成不变，因此算法始终在可行解空间内游走，无需处理约束惩罚项，大大提高了采样效率。
能量评估：计算移动前后序列的G(S)值（使用当前的能量矩阵ε）。
Metropolis准则：以概率min(1, exp(-ΔG / T))接受新状态，其中T是当前温度。
退火计划：从高温T_max开始，逐步降温至T_min。在每一温度下进行一定步数的搜索。

参数设置参考：文中使用了T_max=100,T_min=10^{-4},steps=10^4。这里的能量单位是任意的，所以温度值也是相对的。关键在于高温时能跨越能量壁垒，低温时能稳定在低能区。

实操心得：退火计划与重启策略模拟退火的性能严重依赖于退火计划。线性降温简单但可能不是最优的。可以尝试指数降温：T_{n+1} = α * T_n，其中α略小于1（如0.95）。更有效的方法是采用“重启”策略：运行多次独立的、快速的模拟退火，每次从不同的随机序列开始。这比单次长时间运行更能有效探索解空间。Python的simanneal库是一个不错的起点，但自己实现一个带有定制移动操作的版本（如交换移动）对于理解算法和调试更有帮助。

4.2 GUROBI：经典优化器的威力

GUROBI是一款强大的商业数学规划求解器，能直接处理整数规划、二次规划等问题。将QUBO问题提交给GUROBI，相当于雇佣了一位顶级的经典优化专家。

操作流程：

模型构建：在GUROBI中，你需要定义二进制变量，然后以最小化为目标，添加目标函数Σᵢⱼ Qᵢⱼ xᵢ xⱼ。约束条件（单位置、全局组成）可以作为线性约束直接添加，这比用惩罚项更精确、更高效。
求解：调用GUROBI的求解器。它会运用分支定界、切割平面等一系列高级算法，寻找全局最优解或高质量的可行解。
结果提取：获取变量的最优赋值，解码回蛋白质序列。

文中结果显示，GUROBI在测试中取得了最佳性能。这凸显了经过数十年发展的经典优化软件在解决特定类型组合问题上的成熟度和强大能力。对于许多实际规模的蛋白质设计问题（尤其是变量数在几千以内），GUROBI等求解器可能是最可靠、最快的选择。

4.3 D-Wave混合求解器：量子启发的探索

D-Wave系统通过量子退火原理求解QUBO问题。然而，目前的量子处理器（QPU）量子比特数量有限，且存在噪声。因此，D-Wave提供了“混合求解器”，它将问题分解，一部分在QPU上尝试量子退火寻找低能态，另一部分用经典算法处理，并迭代进行。

使用方式：

问题格式化：将Q矩阵转换为D-Wave API接受的格式（如dimod.BinaryQuadraticModel对象）。
提交求解：调用混合求解器（如LeapHybridSampler）。用户通常无需指定复杂的参数，求解器内部会自动管理经典与量子的分工。
获取样本：返回的是一组低能量样本（解），以及对应的能量值。

文中指出，混合求解器的性能可能代表了“经典与量子步骤最优组合的下界”。这是因为其内部决策对用户不透明，可能未达到理论最优的混合策略。这提醒我们，将问题提交给云量子服务时，要将其视为一个具有潜力的黑盒工具，但其当前表现不一定能超越精心调优的经典算法。它的价值在于为未来纯量子硬件成熟后解决更大规模问题铺平道路，以及为某些特定问题提供新的启发。

三种方法对比总结：

优化方法	原理	优势	劣势	适用场景
模拟退火 (SA)	物理退火过程的模拟，通过概率性接受劣解来逃离局部最优。	实现简单，灵活（可自定义移动操作），内存占用小。	可能陷入局部最优，收敛速度慢，结果具有随机性。	快速原型验证，超大规模问题（变量数>10^5）的近似求解，或当问题有特殊结构适合定制移动时。
GUROBI	基于数学规划理论，运用分支定界、切割平面等精确或启发式算法。	求解能力强，通常能找到全局最优或证明最优性，结果稳定。	商业软件有许可成本，对于某些极端复杂问题可能内存消耗大或耗时久。	中小规模问题（变量数<10^4）的精确或高质量求解，作为性能基准。
D-Wave 混合求解	结合经典计算和量子退火，将问题分解后在量子处理器上采样低能态。	为未来量子优势提供接口，可能为某些问题找到经典算法难以发现的解。	当前硬件限制大，性能可能不如顶级经典求解器，使用成本（按计算时间计费），是黑盒。	探索性研究，评估量子计算对特定问题的潜在价值，问题规模适合当前QPU嵌入能力时。

5. 能量矩阵的学习：感知机与约束分类

迭代框架的核心是让能量矩阵ε越来越“聪明”。第k轮迭代后，我们积累了一批序列S_cum及其折叠验证结果。学习的目标是：调整ε，使得对于“好”的序列，其靶标结构Γ₀的能量低于所有其他构象；同时，对于可折叠的“好”序列，其最低能量构象（即靶标构象）与次低构象的能量差要足够大（大于一个阈值Δ），以确保折叠的稳定性。

这被形式化为一系列线性不等式约束（见原文公式26）。如何找到满足（或尽可能满足）所有这些约束的ε矩阵？文中采用了感知机学习规则。

感知机更新步骤：

将ε矩阵展开成一个向量ε_vec。
每个约束（例如 “序列S在构象Γᵢ的能量应高于在Γ₀的能量”）都可以写成ε_vec · x + c ≥ 0的形式，其中x是由接触图C(Γ)和序列变量q决定的向量，c是常数（如-Δ）。
初始化ε_vec为上一轮的值。
在每一学习步中，检查所有约束，找到被违反最严重的那一个（即ε_vec · x + c最小的那个，如果为负则违反）。
按下式更新参数：ε_vec = ε_vec + η * x。这里η是学习率。这个更新直观上是在把ε_vec向满足被违反约束的方向“推”。
重复步骤4-5，直到所有约束满足或达到最大迭代次数。

注意事项：学习率衰减与约束冲突随着迭代轮次k增加，积累的约束越来越多，新的ε需要满足所有旧约束和新约束。这时，学习率η应该随着k增大而衰减（文中用η = η0 / (1+3k)），以便进行更精细的调整。另一个关键点是，约束之间可能存在冲突（例如，一个序列要求某种相互作用强，另一个序列要求它弱）。感知机算法只能找到可行解（如果存在），否则会在不可行约束间振荡。实践中，我们追求的是最小化违反约束的严重程度，而不是绝对满足所有约束。可以记录整个学习过程中“最严重违反”值的变化，作为算法收敛的指标。

6. 常见问题、调试与性能分析

在实际实现这个框架时，会遇到一系列典型问题。以下是一些排查思路和经验。

6.1 问题：优化器永远找不到可折叠序列。

检查1：能量矩阵初始化。如果初始的ε矩阵是随机的，或者设置不当（例如全是正值），那么G(S)可能没有明确的低能方向，优化失去指导。建议：使用从已知蛋白质结构中统计得到的经验势（如Miyazawa-Jernigan势）作为初始值，这为优化提供了一个合理的起点。
检查2：约束惩罚权重A1, A2。权重过大，优化器所有精力都用在满足约束上，无法优化相互作用；权重过小，会产生大量无效序列（违反约束），浪费计算资源。建议：先单独测试约束满足情况。设置一个极简的目标函数（如常数0），运行优化器，检查输出序列是否满足单位置和组成约束。调整A1, A2直到约束满足率接近100%。然后再引入真实的目标函数。
检查3：折叠验证器的可靠性。在概念验证中，作者使用了穷举枚举以确保正确性。但在实际应用中，你会使用AlphaFold2或Rosetta等预测工具。如果预测器本身不准，那么“可折叠”的判断就是错的，整个学习循环会建立在错误的基础上。建议：在早期调试阶段，可以在一个非常小的、可穷举的系统（如短肽）上验证整个流程，确保折叠验证步骤的准确性。

6.2 问题：感知机学习不收敛，能量矩阵`ε`波动很大。

检查1：学习率η。η太大导致更新步伐过大，在解空间里跳跃；η太小则学习缓慢。建议：实现学习率衰减，并监控目标函数（所有约束违反程度的总和或最大值）随迭代次数的变化。如果目标函数剧烈震荡，调小η0；如果几乎不变，调大η0。
检查2：约束的规模。不同约束对应的向量x的模长可能差异很大，导致更新被少数“大”约束主导。建议：对每个约束的x向量进行归一化处理，使所有约束在更新中具有相近的权重。
检查3：线性不可分。可能不存在一个线性的ε矩阵能完美满足所有约束（这是大概率事件）。建议：不要追求完美收敛。设定一个最大迭代次数（如1000轮）和一个容忍阈值（如95%的约束被满足）。也可以考虑引入“软间隔”，允许少量约束被轻微违反，这可以通过在目标函数中引入松弛变量来实现，这比标准的感知机更鲁棒。

6.3 问题：算法扩展性差，随着蛋白质长度`N`或字母表`D`增大，速度急剧下降。

分析：这是组合优化问题的本质。QUBO变量数~N*D，其复杂度通常是指数级的。文中的图8也显示，成功率随链长增加而下降，随字母表增大而提升（因为搜索空间虽大，但可区分的相互作用也更多）。
优化建议：
1. 利用稀疏性：蛋白质接触图C是稀疏的（每个残基只与少数邻近残基接触）。构建Q矩阵时，只处理Cᵢⱼ ≠ 0的位置对，可以极大减少计算量和内存占用。
2. 分层设计：不要一次性设计整个蛋白质。可以先固定关键的功能位点或结构核心（如疏水核心），只优化其余部分。或者采用“片段组装”策略，先设计小的二级结构片段，再优化连接区域。
3. GPU加速：如果使用基于梯度的优化方法或需要频繁评估能量，考虑使用GPU加速矩阵运算和能量计算。
4. 启发式预筛选：在进入昂贵的QUBO优化或折叠预测之前，先用快速的、基于统计或简单规则的过滤器淘汰掉明显不合理的序列。

6.4 性能评估与基准测试

如何判断你的设计算法成功了？不能只看最终找到了一个可折叠序列。

成功率：运行多次独立的设计流程（从不同的初始序列或随机种子开始），计算成功设计出可折叠序列的比例。如图8所示，这是衡量算法鲁棒性的关键指标。
序列多样性：检查算法在不同运行中产生的成功序列是否多样。如果总是收敛到极相似的序列，说明算法可能陷入了狭窄的局部最优，或者能量矩阵ε的引导性过强。
与天然序列的对比：将设计出的序列与已知的、折叠到类似结构的天然序列进行比对。分析它们在物理化学性质（如疏水性、电荷分布）上的异同。这能验证你的算法是否学到了有生物学意义的规律。
计算成本：记录每一轮迭代中，序列优化和折叠验证所花费的时间。这对于评估算法在实际应用中的可行性至关重要。QUBO求解和结构预测（如调用AlphaFold2）通常是计算瓶颈。

这个将机器学习、QUBO优化和量子计算思想融合的蛋白质设计框架，为我们打开了一扇新的大门。它不再依赖于人工编写的规则，而是让数据驱动优化。尽管目前在处理全尺寸、真实蛋白质时仍面临计算挑战，但其方法论已经清晰。随着优化算法、预测模型和计算硬件的持续进步，这种自动化、迭代式的设计范式，有望在未来成为蛋白质工程师手中一件强大的工具，加速从药物设计到合成生物学等多个领域的创新。在实际操作中，耐心调试每个模块的参数，并建立系统的验证和评估流程，是走向成功的关键。

查看全文

http://www.jsqmd.com/news/876281/