当前位置：首页 > news >正文

2026 每日阅读｜NEMAT：用 GROMACS 拆开膜蛋白药物亲和力的“障眼法”

news 2026/7/2 5:57:15

如果一个小分子特别喜欢钻进脂质膜，它在膜蛋白附近的浓度自然会升高。此时实验看见的“结合更强”，究竟来自真正的蛋白-配体相互作用，还是因为膜先把配体富集到了受体旁边？

这是今天这篇论文最有意思的问题。

2026 年 5 月，Journal of Chemical Information and Modeling发表了 NEMAT：一套基于 GROMACS 的自动化非平衡自由能计算框架。它不满足于告诉我们“配体在模拟中没有跑掉”，而是尝试把膜蛋白配体的表观亲和力拆成两个部分：进入膜的贡献与真正识别受体的贡献。

本文是“每日一篇新文献”读书日记。目标不是逐句翻译论文，而是把研究问题、方法、关键结果和局限讲清楚。

今日论文卡片

项目	内容
题目	NEMAT: An Automated Nonequilibrium Free-Energy Framework for Predicting Ligand Affinity in Membrane Proteins
作者	Albert Ortega-Bartolomé、Ramon Crehuet
期刊	Journal of Chemical Information and Modeling
在线发表	2026 年 5 月 13 日
DOI	10.1021/acs.jcim.5c03089
研究对象	P2Y1 受体与 BPTU 类拮抗剂
核心工具	GROMACS 2024.2、pmx、ACPYPE、GAFF2、BAR
开源代码	QTC-IQAC/NEMAT

先给结论

我认为这篇论文真正值得记住的不是“又有一个自动化脚本”，而是下面三点：

膜蛋白配体的表观亲和力不只由蛋白决定。配体进入脂质膜的倾向，可能显著改变实验观察到的结合。
NEMAT 把一个亲和力变化拆成膜分配与受体识别两个部分。这比只给出一个总分更有机制解释力。
在 P2Y1/BPTU 基准中，NEMAT 大体复现实验排序，但还远未达到“输入化合物，自动得到可靠答案”的程度。单一 GPCR、单一 POPC 膜、有限配体系列和若干内部数值不一致，都要求我们保持克制。

为什么普通的蛋白-配体思维在膜蛋白上可能失灵

处理可溶性蛋白时，我们经常把配体从水相进入结合位点看作主要过程。膜蛋白多了一层麻烦：配体可能先从水进入膜，再沿着膜侧进入受体口袋。

这意味着实验观察到的结合自由能可以写成：

ΔGobs = ΔGmem + ΔGint

ΔGobs：实验最终观察到的总体结合自由能；
ΔGmem：配体从水相进入脂质膜的自由能；
ΔGint：配体从膜环境进入受体位点、形成特异相互作用的自由能。

如果一个分子非常亲脂，ΔGmem 可能很有利。即使它对蛋白口袋的特异识别一般，膜的富集效应也可能让总体结合看起来不错。反过来，一个对蛋白识别很好的分子，如果不愿进入膜，也可能难以到达膜侧口袋。

图 1｜NEMAT 的热力学循环。配体 0 与配体 1 分别在水、膜和膜蛋白环境中进行炼金转换。程序实际模拟纵向的 ΔG 路径，再组合得到 ΔΔGobs、ΔΔGmem 与 ΔΔGint。图源：原论文 Figure 1，CC BY 4.0。

这张图是全文的灵魂。NEMAT 不直接模拟配体漫长的结合过程，而是比较两个相似配体之间的“炼金变化”：在计算机中逐渐关闭配体 A 的部分原子，同时逐渐打开配体 B 的对应原子。

这种路径并不真实存在，但只要热力学循环闭合，就可以得到两个配体之间的相对结合自由能。

NEMAT 到底自动化了什么

NEMAT 是 Python3 与 Bash 组成的工作流，底层模拟由 GPU 加速的 GROMACS 完成。它将一对配体的计算拆成三个并行环境：

水相；
纯脂质膜；
含目标膜蛋白的脂质膜。

配体之间的最大公共子结构由 RDKit/pmx 映射；ACPYPE/Antechamber 使用 GAFF2 生成小分子参数；正向与反向非平衡功分布最后通过 Bennett Acceptance Ratio（BAR）估算自由能差。

图 2｜NEMAT 工作流。用户提供配体、纯膜和膜蛋白体系；NEMAT 处理公共子结构映射、混合拓扑、GROMACS 正反向转换以及功分布分析。图源：原论文 Figure 2，CC BY 4.0。

它自动化的主要步骤包括：

根据最大公共子结构生成配体映射；
用 pmx 建立同时包含真实原子和 dummy atoms 的混合拓扑；
为每条 transformation edge 建立三个环境；
运行多重复平衡、生产模拟和正反向非平衡转换；
分析功分布并输出相对自由能及误差。

不过，“自动化”不等于“无需判断”。膜蛋白结构、膜组成、质子化状态、配体构象和力场兼容性仍需研究者负责。论文也明确建议：先在少量 transformation edges 上调节参数，检查正反向功分布重叠和误差，再扩大计算。

非平衡 FEP，可以怎样直观理解

传统平衡 FEP/TI 往往需要在多个 λ 窗口之间逐步采样。NEMAT 采用 NEQ-FEP：先分别为 λ=0 与 λ=1 的端点跑平衡生产轨迹，然后从多个快照出发，快速执行 A→B 与 B→A 的非平衡转换。

图 3｜非平衡 FEP 的直观示意。从两个端点的生产轨迹抽取快照，执行正反向快速转换，再由两组功分布估计 ΔG。图源：原论文 Figure 3，CC BY 4.0。

这里必须盯住两个质量信号：

正向与反向功分布是否有足够重叠；
独立重复之间是否给出一致结果。

如果两组分布离得很远，BAR 可能仍输出一个数字，但这个数字未必值得相信。NEMAT 默认采用 3 个独立重复，并允许增加重复数来降低统计不确定性。

这篇论文实际跑了什么

作者选择 P2Y1 受体的膜侧变构口袋作为 benchmark。BPTU 及其类似物恰好位于蛋白-脂质界面，非常适合检验“膜分配”和“蛋白识别”能否被拆开。

核心体系设置如下：

参数	设置
膜蛋白结构	P2Y1-BPTU，PDB 4XNV，2.2 Å
蛋白力场	Amber ff19SB
膜	233 个 POPC，Lipid21
水与离子	TIP3P，0.15 M NaCl
小分子	GAFF2，AM1-BCC 电荷
GROMACS	2024.2
独立重复	3
生产轨迹	每个端点 20 ns
非平衡转换	50 次，均匀取样，每次 100 ps
时间步长	2 fs

补充材料还给出了几个很实用的工程数字：三个环境和三个重复可以高度并行；使用 A100 GPU 与 GROMACSmultidir时，转换阶段相对串行执行约快 15 倍；每条 transformation edge 约需要 15 GB 存储空间。

作者测试了不同参数后认为：

5 ns 与 20 ns 的生产轨迹均可给出接近结果，但 20 ns 能让抽取快照间隔更大；
50 次转换后继续增加到 80 或 100 次，收益有限；
50 ps 转换明显不够，100 ps 与 200 ps 更一致，因此默认采用 100 ps。

这些默认值是起点，不是通用定律。柔性更高的配体、复杂膜或慢构象变化都可能需要更长采样。

Benchmark 结果：好到什么程度

作者最终重点分析了 14 个有膜分配参考数据的 BPTU 类拮抗剂，并分成以 11a 和 6a 为中心的两个系列。

在 11a 系列中，NEMAT 对所有配体都预测对了亲和力变化方向；
在 6a 系列中，若把两个接近零的实验差异考虑在内，方向预测正确率为 87.5%；
总体排序相关性为 Kendall τ=0.42，r²=0.44。

图 4｜计算与实验绝对结合自由能的比较。虚线为理想一致关系，蓝点与红点来自两个配体子系列。图中报告 RMSD=1.51 kcal/mol、MUE=1.28 kcal/mol。图源：原论文 Figure 4，CC BY 4.0。

这个结果足以说明 NEMAT 能提供有用的先后排序，但不能说已经“精准预测”所有分子。r²=0.44 代表仍有大量变异没有被模型解释，图中也能看到几处明显偏离理想线的点。

更值得注意的是，论文正文写的是 RMSD=1.69 kcal/mol、MUE=1.39 kcal/mol，而 Figure 4 与补充 Figure S13 显示 RMSD=1.51、MUE=1.28。两组 Kendall τ 和 r² 一致。这很可能来自分析版本或绘图数据更新未同步，但作者没有解释。写博客时我选择把两组数字都列出来，而不是悄悄替作者决定哪一个才对。

我认为最有价值的结果，不是总体 ΔG

NEMAT 最有意思的输出其实是 ΔΔGmem 和 ΔΔGint。

假设两个新化合物的 ΔΔGobs 都比先导物更有利：

化合物 A 的提升主要来自 ΔΔGmem，说明它更容易进入膜；
化合物 B 的提升主要来自 ΔΔGint，说明它对受体口袋的特异识别更强。

从药物优化角度看，这两种“变强”完全不是一回事。过度提高亲脂性可能带来非特异膜富集、溶解度下降和药代问题；真正改善蛋白特异相互作用通常更接近我们想要的选择性优化。

遗憾的是，目前缺少可以分别验证 ΔΔGmem 和 ΔΔGint 的实验数据。论文只能用 logP 与 ΔΔGmem 的方向一致性做定性检查。因此，这个分解在机制上很诱人，但精度还不能被独立确认。

这篇论文的优点

1. 问题选得好

膜侧口袋是自由能计算中经常被简化的区域。论文没有假装膜只是背景，而是把膜本身纳入热力学循环。

2. 不只发布概念，还发布可运行工作流

代码、输入、分析脚本和复现实例均在 GitHub 提供，论文 benchmark 可以通过nemat example建立。相比只给一张流程图却不公开参数，这一点很扎实。

3. 参数测试比较务实

作者没有只报一个默认值，还测试了生产时间、转换次数和转换长度，并给出并行效率与存储成本。这些信息对真正准备上机的人很有价值。

我保留意见的地方

1. Benchmark 仍然很窄

只有一个 class A GPCR、一个脂质暴露口袋和 14 个重点配体。它是否适用于内嵌口袋、转运体、离子通道或化学差异更大的配体，尚未证明。

2. 膜模型仍然简化

研究使用单组分 POPC。真实细胞膜包含胆固醇、鞘脂和多类磷脂，且常具有不对称性。对膜侧配体而言，这不是小细节。

3. 柔性配体和慢膜过程仍可能采样不足

20 ns 生产轨迹对某些体系够用，但不能自动解决慢构象变化。作者也承认，必要时可能需要延长生产段或引入增强采样。

4. 三重复的加权方式值得检查

NEMAT 默认用高斯权重降低离群重复的贡献。它能减少异常值影响，但若离群重复代表真实的另一种构象状态，自动降权也可能掩盖问题。使用者应同时查看每个重复，而不是只读最终平均值。

5. 论文内部数字没有完全同步

正文和 Figure 4 对 RMSD/MUE 的报告不一致。这不改变总体结论，却提醒我们：任何自动化 pipeline 的最终数字仍需要人工审阅。

如果我是使用者，我会怎样开始

我不会一上来就计算几十个化合物，而会这样做：

选择 3-5 个有实验亲和力、结构变化较小的配体；
检查膜蛋白结构、质子化状态、膜组成与结合姿势；
审核配体 MCS 映射、AM1-BCC 电荷和 GAFF2 参数；
先跑少量 edges，检查每个环境的正反向功分布；
比较三个独立重复，不让加权平均掩盖异质性；
对 ΔΔGobs、ΔΔGmem、ΔΔGint 分别解释，并与实验 SAR 对照；
最后才扩大到完整配体系列。

今日读书日记

今天最大的收获，是重新理解了“膜蛋白的结合亲和力”。

以前看到一个膜蛋白-配体体系，我容易把注意力全部放在口袋里的氢键、疏水作用和 RMSD 上。NEMAT 提醒我，配体抵达口袋之前，膜已经参与了选择。一个分子是因为真正认出了受体，还是因为先被膜吸了过去，这两件事必须分开讨论。

这篇论文还让我确认了一件老生常谈却很容易忘记的事：计算方法的自动化可以减少手工错误，但不能替代科学判断。工作流可以自动生成拓扑、提交任务和画图，却不会替你判断采样是否充分、膜是否真实、离群重复是否有物理意义。

如果后续 NEMAT 能扩展到复杂不对称膜、更多力场和不同类型膜蛋白，它会很有潜力成为膜蛋白药物设计中实用的一层基础设施。现在的它，更适合被视为一个公开、可复现、值得继续验证的起点。

原文与资源

论文：NEMAT: An Automated Nonequilibrium Free-Energy Framework for Predicting Ligand Affinity in Membrane Proteins
PubMed：PMID 42130012
PMC 开放全文：PMC13213831
GitHub：QTC-IQAC/NEMAT
文档：NEMAT Documentation

如果你也在做 GPCR、膜蛋白、小分子结合或 GROMACS 自由能计算，想找我们做复现或者新的研究，欢迎私信我，或者前往博客《智澈乐尚网络工作平台》阅读一下，下一篇读书日记，我会继续沿着“膜环境如何改变药物结合”这条线往下读。

查看全文

http://www.jsqmd.com/news/1107041/