当前位置：首页 > news >正文

探索DeepPurpose预训练模型：10分钟实现SARS-CoV-3CL蛋白酶抑制剂虚拟筛选

news 2026/7/23 7:48:02

探索DeepPurpose预训练模型：10分钟实现SARS-CoV-3CL蛋白酶抑制剂虚拟筛选

【免费下载链接】DeepPurposeA Deep Learning Toolkit for DTI, Drug Property, PPI, DDI, Protein Function Prediction (Bioinformatics)项目地址: https://gitcode.com/gh_mirrors/de/DeepPurpose

DeepPurpose是一个强大的深度学习工具包，专门用于药物-靶点相互作用预测、药物性质预测和蛋白质功能预测等生物信息学任务。今天我们将重点介绍如何利用DeepPurpose的预训练模型，在短短10分钟内完成SARS-CoV-3CL蛋白酶抑制剂的虚拟筛选工作。这种快速高效的虚拟筛选方法为药物研发提供了革命性的工具，让研究人员能够快速识别潜在的治疗候选药物。

🚀 DeepPurpose预训练模型简介

DeepPurpose提供了超过10个预训练模型，涵盖了多种药物编码和目标编码组合。这些模型已经在大规模数据集上进行了训练，包括BindingDB、DAVIS和KIBA等知名数据库。预训练模型可以直接用于预测任务，无需从头开始训练，大大节省了时间和计算资源。

核心功能特点

多任务支持：支持药物-靶点相互作用预测、药物性质预测、蛋白质-蛋白质相互作用预测等
预训练模型库：提供丰富的预训练模型，覆盖不同的编码策略
一键式操作：通过简单的API调用即可完成复杂的虚拟筛选任务
高性能计算：支持GPU加速，提高计算效率

🔍 SARS-CoV-3CL蛋白酶虚拟筛选实战

SARS-CoV-2的3CL蛋白酶是病毒复制过程中的关键酶，是抗病毒药物开发的重要靶点。使用DeepPurpose进行虚拟筛选可以快速识别潜在的抑制剂。

准备工作：环境配置

首先需要克隆DeepPurpose仓库并安装必要的依赖：

git clone https://gitcode.com/gh_mirrors/de/DeepPurpose cd DeepPurpose conda env create -f environment.yml conda activate DeepPurpose

步骤一：加载预训练模型

DeepPurpose提供了多种预训练模型，包括：

MPNN_CNN_BindingDB：使用MPNN药物编码和CNN蛋白质编码
CNN_CNN_DAVIS：使用CNN药物编码和CNN蛋白质编码
Morgan_CNN_KIBA：使用Morgan指纹药物编码和CNN蛋白质编码

加载预训练模型非常简单：

from DeepPurpose import DTI as models model = models.model_pretrained(model='MPNN_CNN_BindingDB')

步骤二：准备数据

DeepPurpose内置了SARS-CoV-2 3CL蛋白酶序列和抗病毒药物数据集：

from DeepPurpose.dataset import * target, target_name = load_SARS_CoV2_Protease_3CL() X_repurpose, drug_names, drug_CID = load_antiviral_drugs()

步骤三：执行虚拟筛选

使用oneliner.repurpose()函数可以一键完成虚拟筛选：

from DeepPurpose import oneliner results = oneliner.repurpose(target, target_name, X_repurpose, drug_names)

📊 虚拟筛选结果分析

DeepPurpose的虚拟筛选结果会按照结合亲和力评分进行排序，输出前30个最有潜力的候选药物。以下是部分筛选结果示例：

排名	药物名称	靶点名称	结合评分
1	Sofosbuvir	SARS-CoV-2 3CL蛋白酶	190.25
2	Daclatasvir	SARS-CoV-2 3CL蛋白酶	214.58
3	Vicriviroc	SARS-CoV-2 3CL蛋白酶	315.70
4	Simeprevir	SARS-CoV-2 3CL蛋白酶	396.53
5	Etravirine	SARS-CoV-2 3CL蛋白酶	409.34

这些结果提供了重要的参考信息，帮助研究人员快速识别潜在的候选药物进行进一步实验验证。

🎯 DeepPurpose的核心优势

1. 快速部署与使用

DeepPurpose提供了简洁的API接口，即使是深度学习新手也能快速上手。通过几行代码就能完成复杂的虚拟筛选任务。

2. 多种编码策略支持

DeepPurpose支持多种药物和蛋白质编码方法：

药物编码：MPNN、CNN、Morgan指纹、Daylight指纹
蛋白质编码：CNN、AAC（氨基酸组成）

3. 灵活的微调功能

除了使用预训练模型，DeepPurpose还支持在特定数据集上进行微调，提高模型在特定任务上的性能。

4. 完整的评估指标

DeepPurpose提供了全面的评估指标，包括AUROC、AUPRC、F1分数等，帮助用户全面评估模型性能。

📁 项目结构与关键文件

DeepPurpose的项目结构清晰，主要模块包括：

DeepPurpose/ ├── DTI.py # 药物-靶点相互作用预测模块 ├── oneliner.py # 一键式操作接口 ├── dataset.py # 数据加载和处理模块 ├── encoders.py # 编码器模块 └── DEMO/ # 示例代码目录

关键文件路径

核心API接口：oneliner.py
数据加载模块：dataset.py
预训练模型使用示例：DEMO/case-study-I-Drug-Repurposing-for-3CLPro.ipynb
快速微调示例：DEMO/oneliner-3CLpro-finetuning-AID1706.ipynb

🔧 高级功能：模型微调

对于特定任务，DeepPurpose支持在预训练模型基础上进行微调。以SARS-CoV-3CL蛋白酶抑制剂筛选为例：

from DeepPurpose import oneliner from DeepPurpose.dataset import * # 加载数据和预训练模型 target, target_name = load_SARS_CoV_Protease_3CL() train_drug, train_target, train_y = load_AID1706_SARS_CoV_3CL('./data') X_repurpose, drug_names, drug_CID = load_antiviral_drugs() # 微调并筛选 results = oneliner.repurpose( target=target, target_name=target_name, train_drug=train_drug, train_target=train_target, train_y=train_y, X_repurpose=X_repurpose, drug_names=drug_names, finetune_epochs=10, finetune_LR=0.001 )

💡 最佳实践建议

1. 选择合适的预训练模型

根据任务类型选择合适的预训练模型：

BindingDB数据集：适用于一般药物-靶点相互作用预测
DAVIS数据集：适用于激酶抑制剂筛选
KIBA数据集：适用于多靶点药物筛选

2. 数据预处理

确保输入数据的格式正确：

药物使用SMILES字符串表示
蛋白质使用氨基酸序列表示
标签数据格式统一

3. 结果验证

虚拟筛选结果需要进一步验证：

进行分子对接模拟
实验验证结合活性
考虑ADMET性质

🚨 注意事项

结果解释：虚拟筛选结果仅供参考，需要专家进一步评估
数据质量：输入数据质量直接影响预测结果
模型局限性：深度学习模型存在一定的局限性，需要结合其他方法
计算资源：大规模筛选需要足够的计算资源

📈 未来发展方向

DeepPurpose团队正在不断改进和扩展功能，未来计划包括：

更多预训练模型的发布
支持更多药物和蛋白质编码方法
集成更多生物信息学工具
提供Web界面方便使用

🎉 总结

DeepPurpose为药物发现研究提供了强大的工具支持，特别是其预训练模型功能，让研究人员能够在短时间内完成大规模的虚拟筛选任务。通过简单的API调用，即使是缺乏深度学习经验的研究人员也能快速上手，加速药物研发进程。

无论你是药物研发人员、生物信息学研究者，还是对AI在生物医药领域应用感兴趣的开发者，DeepPurpose都值得你尝试和使用。现在就开始你的药物虚拟筛选之旅吧！

提示：所有代码示例都可以在DeepPurpose的DEMO目录中找到，建议从案例研究开始学习。

【免费下载链接】DeepPurposeA Deep Learning Toolkit for DTI, Drug Property, PPI, DDI, Protein Function Prediction (Bioinformatics)项目地址: https://gitcode.com/gh_mirrors/de/DeepPurpose

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/881216/