当前位置: 首页 > news >正文

第三十九篇:分子动力学中的蛋白质折叠模拟

第三十九篇:分子动力学中的蛋白质折叠模拟

摘要

蛋白质折叠是分子生物学的核心问题之一。本主题介绍蛋白质折叠的分子动力学模拟方法,包括折叠路径分析、中间态识别、以及增强采样技术的应用。

关键词

蛋白质折叠;折叠路径;自由能景观;增强采样;副本交换;元动力学


1. 蛋白质折叠概述

1.1 折叠问题

  • Levinthal悖论:蛋白质如何在短时间内找到天然构型?
  • 能量景观理论:折叠是能量漏斗上的引导过程
  • 折叠协同性:二级和三级结构同时形成

1.2 折叠模型

  • 框架模型:先形成二级结构再组装
  • 成核-凝聚模型:折叠核先形成
  • 疏水塌缩模型:先发生疏水塌缩

2. 增强采样方法

2.1 副本交换MD(REMD)

多个温度副本并行模拟,定期交换构型:

Paccept=min⁡(1,exp⁡[(βi−βj)(Ei−Ej)])P_{\text{accept}} = \min\left(1, \exp\left[(\beta_i - \beta_j)(E_i - E_j)\right]\right)Paccept=min(1,exp[(βiβj)(EiEj)])

2.2 元动力学(Metadynamics)

在集体变量空间添加偏置势:

VG(s,t)=∑t′=τG,2τG,...t′Wexp⁡(−(s−s(t′))22δs2)V_G(s, t) = \sum_{t' = \tau_G, 2\tau_G, ...}^{t'} W \exp\left(-\frac{(s - s(t'))^2}{2\delta s^2}\right)VG(s,t)=t=τG,2τG,...tWexp(2δs2(ss(t))2)

2.3 伞形采样

沿反应路径进行约束采样:

U′=U+12k(ξ−ξ0)2U' = U + \frac{1}{2}k(\xi - \xi_0)^2U=U+21k(ξξ0)2


3. 折叠分析

3.1 反应坐标

  • RMSD:与天然结构的偏差
  • 回转半径Rg=1N∑i(ri−rcm)2R_g = \sqrt{\frac{1}{N}\sum_i (\mathbf{r}_i - \mathbf{r}_{\text{cm}})^2}Rg=N1i(rircm)2
  • 氢键数目:二级结构指标
  • 接触数:残基-残基接触

3.2 自由能景观

F(ξ)=−kBTln⁡P(ξ)F(\xi) = -k_B T \ln P(\xi)F(ξ)=kBTlnP(ξ)


4. Python实现

""" 蛋白质折叠模拟分析 包含:RMSD计算、接触图、自由能景观 """importnumpyasnpimportmatplotlib.pyplotaspltimportos output_dir=r'd:\文档\分子动力学\主题039'os.makedirs(output_dir,exist_ok=True)defcompute_radius_of_gyration(positions):""" 计算回转半径 Parameters ---------- positions : ndarray (N, 3) 原子位置 Returns ------- float 回转半径 (Å) """center=np.mean(positions,axis=0)rg_squared=np.mean(np.sum((positions-center)**2,axis=1))returnnp.sqrt(rg_squared)defcompute_native_contacts(positions,native_positions,cutoff=6.0):""" 计算天然接触数 Parameters ---------- positions : ndarray (N, 3) 当前位置 native_positions : ndarray (N, 3) 天然态位置 cutoff : float 接触截断距离 (Å) Returns ------- float 天然接触比例 """N=len(positions)n_contacts=0n_native=0foriinrange(N):forjinrange(i+5,N):# 排除近邻r_native=np.linalg.norm(native_positions[i]-native_positions[j])r_current=np.linalg.norm(positions[i]-positions[j])ifr_native<cutoff:n_native+=1ifr_current<1.2*cutoff:# 稍微放宽标准n_contacts+=1returnn_contacts/n_nativeifn_native>0else0defvisualize_folding():"""可视化折叠分析"""fig,axes=plt.subplots(1,2,figsize=(12,5))# 1. 自由能景观 (FEL)ax1=axes[0]# 模拟数据rmsd=np.linspace(0,10,100)rg=np.linspace(10,25,100)RMSD,RG=np.meshgrid(rmsd,rg)# 双势阱自由能面F=2*(RMSD-2)**2+0.1*(RG-15)**2+5*np.exp(-((RMSD-6)**2+(RG-20)**2)/5)contour=ax1.contourf(RMSD,RG,F,levels=20,cmap='viridis')plt.colorbar(contour,ax=ax1,label='Free Energy (kcal/mol)')# 标记状态ax1.scatter(2,15,c='red',s=200,marker='*',label='Folded',zorder=5)ax1.scatter(6,20,c='blue',s=200,marker='o',label='Unfolded',zorder=5)ax1.set_xlabel('RMSD (Å)')ax1.set_ylabel('R_g (Å)')ax1.set_title('Free Energy Landscape')ax1.legend()# 2. 折叠路径ax2=axes[1]time=np.linspace(0,1000,1000)# ns# 模拟折叠轨迹np.random.seed(42)rmsd_traj=8*np.exp(-time/200)+2+0.5*np.random.randn(1000)rmsd_traj=np.maximum(rmsd_traj,1.5)ax2.plot(time,rmsd_traj,'b-',alpha=0.5,linewidth=1)ax2.scatter(time[::50],rmsd_traj[::50],c=time[::50],cmap='coolwarm',s=30,zorder=5)ax2.axhline(3,color='red',linestyle='--',alpha=0.5,label='Folded threshold')ax2.set_xlabel('Time (ns)')ax2.set_ylabel('RMSD (Å)')ax2.set_title('Folding Trajectory')ax2.legend()ax2.grid(True,alpha=0.3)plt.tight_layout()plt.savefig(f'{output_dir}/folding_analysis.png',dpi=150)plt.close()print(f"可视化结果已保存至:{output_dir}")if__name__=="__main__":# 生成测试结构np.random.seed(42)# 天然态(紧凑)native_pos=np.random.randn(50,3)*2# 去折叠态(伸展)unfolded_pos=np.random.randn(50,3)*8rg_native=compute_radius_of_gyration(native_pos)rg_unfolded=compute_radius_of_gyration(unfolded_pos)print(f"天然态 Rg:{rg_native:.2f}Å")print(f"去折叠态 Rg:{rg_unfolded:.2f}Å")# 计算天然接触Q=compute_native_contacts(unfolded_pos,native_pos)print(f"天然接触比例:{Q:.2%}")visualize_folding()print("\n蛋白质折叠模拟分析完成!")

5. 总结

蛋白质折叠模拟的关键要点:

  1. 使用增强采样方法克服时尺度问题
  2. 选择合适的集体变量
  3. 构建自由能景观
  4. 识别折叠中间态和路径

参考文献

  1. Piana, S., et al. (2014). Equilibrium folding simulations of the villin headpiece in atomistic detail. Nat. Commun., 5, 5272.
  2. Lindorff-Larsen, K., et al. (2011). How fast-folding proteins fold. Science, 334(6055), 517-520.
http://www.jsqmd.com/news/397017/

相关文章:

  • 第四十篇:分子动力学中的核酸模拟
  • 鲜花追忆
  • Java线程池:深入理解ThreadPoolExecutor及其参数配置
  • 数据在内存中的存储
  • 互联网大厂求职秘籍:Java小白面试核心技术点全解析
  • Flink 2.0 解耦状态管理(Disaggregated State)ForSt + 异步 State API V2 + SQL Async-State 上手与调优
  • 写一个自动整理聊天记录精华工具,提炼重要信息,颠覆翻记录找半天。
  • 谷歌不淡定了
  • “老东西,你懦弱了”——关于Vibe Coding与传统开发 - Ghost
  • treeNMS-1.7.5部署步骤详解(附Java环境准备与数据库配置)
  • 镜像视界核心技术群白皮书总章——空间计算引擎的技术体系全景与原创突破
  • 激光雷达(LiDAR):信号回波效率【自车能接收到反射激光的比例:10⁻¹⁰量级】【905nm激光脉冲包含10¹³光子,在200米处探测10%反射率目标,最终返到接收器的光子数只有几百~几千个】
  • 香港中巴租赁市场新动态:口碑佳企推荐,婚礼租车/自驾租车/租赁/代驾租车/婚车租赁/商务租车/跨境租车,租赁企业口碑排行 - 品牌推荐师
  • IcePop技术
  • 军储 × 危化联动空间主动封控体系装备论证——基于视频孪生感知网与镜像孪生控制网的三维空间战术级压制系统
  • 视频孪生的时代边界与镜像孪生的空间计算革命
  • 激光雷达(LiDAR)-高速运动的影响03:多普勒效应【绝大多数车载LiDAR采用飞行时间(ToF)原理,通过测量光脉冲的往返时间来计算距离,而非测量光的频率,∴多普勒效应对测距精度影响甚微】
  • 第二章 字符串和文本 上
  • “赛博大佛” Cloudflare(简称 CF)
  • 第二章 字符串和文本 下
  • 激光雷达(LiDAR):发射激光的反射为何能被自身收到【漫反射:多数物体总会将一部分入射光散射回发射源方向】【激光特性:①发散角小,即使经过漫反射,散射回的信号也足够强;②高单色性;③高能量密度】
  • 激光雷达(LiDAR)-高速运动的影响02:畸变【对一帧内所有点去畸变:①GPSIMU(打时间戳)、激光脉冲(打时间戳)⮕时间戳同步⮕坐标系变换(将点从运动中的传感器坐标系转换到固定的世界坐标系)】
  • 网站突然变慢到底是不是“服务器不行”?
  • Claude Code编程经验记录总结-构建项目规约
  • 被忽略的核心!状态转移概率矩阵:马尔可夫链的“人性破局工具”
  • 马尔可夫链的灵魂:状态转移矩阵揭秘
  • 2026年外贸推广国际社媒TikTok推广代运营公司/服务商深度测评榜单:这5家值得重点关注! - 深圳昊客网络
  • 2026年观察:国内AI选果机市场主流厂家技术解析,梨分选机/无损选果机/无损测糖选果机,选果机销售厂家怎么选择 - 品牌推荐师
  • 写作小白救星!千笔写作工具,本科生论文必备神器
  • 实测才敢推 8个降AI率工具:继续教育降AI率全维度测评