当前位置: 首页 > news >正文

医学应用“药物研发“高价值专利案例:基于图神经网络的药物性质预测方法

课题来源:某国家级新药筛选中心横向委托项目

案例定位:面向药物发现早期ADMET评价成本高、周期长、数据多源异构等瓶颈的分子图智能预测与虚拟筛选技术转化研究

1 项目背景

药物ADMET性质评价是解决候选药物安全性、有效性的关键环节。传统实验方法昂贵耗时,严重制约早期药物筛选效率。随着ChEMBL、PubChem等数据库积累了大量ADMET数据,以及图神经网络在分子表征学习上展现出对结构信息更强的捕捉能力,构建数据驱动的ADMET预测模型具备可行性。然而,多源数据异构性强、标准化程度低,传统机器学习方法依赖分子指纹存在信息损失,预测精度面临瓶颈。

深度森林从专利挖掘与高价值技术转化的角度切入,围绕“多源数据整合—分子图表征—注意力机制建模—分类预测—虚拟筛选应用”全链路技术路径,完成了包含基于图注意力网络的药物ADMET分类预测模型构建方法、面向虚拟筛选的多属性预测系统等在内的多项发明专利群布局,并同步依托公开基准数据集完成了模型性能验证。

2 本专利要解决的问题

(1)多源ADMET数据实验条件不一、分子结构表示差异大,人工整合困难,缺乏标准化数据预处理流程。
(2)传统分子指纹和分子描述符造成结构信息损失,机器学习模型难以充分学习化学结构与药效学之间的复杂关联。
(3)常规图神经网络在节点更新时不能自适应区分邻居节点的重要性差异,模型预测性能与泛化能力受限。

3 专利技术核心价值点

3.1 多源异构ADMET数据的标准化预处理与整合方法

本发明构建了一套针对多源药物ADMET数据的标准化数据预处理流程。通过实验条件筛选(温度、pH值、靶标、溶剂等规范化筛选)、药物分子结构标准化(脱盐加氢、手性标准化、电荷质子化、去除超分子基团与金属络合物等),以及结合自动去重与人工校正的多源异构数据整合流程,将来自ChEMBL、PubChem、Reaxys等不同数据库的ADMET属性数据进行统一映射和质量控制,最终形成共9种ADMET属性、总计149,457条高质量数据,为模型训练奠定数据基础。

3.2 基于图注意力网络的分子图特征学习与预测模型

本发明采用图注意力网络构建分子结构特征抽取层,以图结构表示分子(原子为节点、化学键为边),构造邻接矩阵与度矩阵,引入注意力机制实现节点更新时自适应地聚合邻居信息。注意力相关系数的计算机制如下:

其中,eij为连接节点i和j的边向量表示,Ni为节点i的邻居节点集合。节点特征更新遵循:

经特征抽取层完成节点特征更新后,采用最大聚合READOUT函数进行图级聚合,再输入线性层与Sigmoid激活函数输出二分类预测概率:

该设计使模型能够根据邻居节点的重要性自动分配注意力权重,更有效地学习分子图中对ADMET属性起关键作用的局部子结构信息。

3.3 基于分子骨架分层划分的数据集构建与模型评估

针对常规随机划分导致模型泛化能力“高估”的问题,本发明采用基于Bemis-Murcko分子骨架的分层划分方法,将具有相同分子骨架的药物归入同一集合,按照8:2比例划分训练集与测试集。该方法消除了结构信息泄露造成的数据集偏倚,构造出更接近真实虚拟筛选场景的预测任务,使模型评估结果更能反映其对新型骨架分子的预测能力。

3.4 多模型对比验证与ADMET属性综合预测

本发明在9个ADMET属性数据集上,将图注意力网络模型与随机森林、K近邻、逻辑回归三种机器学习模型,以及图卷积网络、消息传递神经网络两种图神经网络模型进行全面性能对比。基于图注意力网络的模型在9个数据集中平均准确率达0.825、平均F1分数达0.672,较基线模型平均准确率提升最高达6.4%,平均F1分数提升最高达26.0%,在类别不均衡的数据集上优势尤为显著。

4 专利转化验证与分析

为验证本发明方法在药物ADMET性质预测中的有效性与领先性,基于9个ADMET属性、共149,457条数据开展实验验证。

在数据预处理效率对比中,本发明构建的标准化流程将来自多个数据库的异构数据从原始下载到完成标准化整合的整体周期缩短至天级,解决了传统人工逐条处理上千条数据的低效问题,数据整合一致性达到100%。

在预测性能验证中,针对药物代谢属性(CYP450各亚型抑制),本发明模型在P450 2C9与P450 2C19等关键亚型预测上,F1分数分别达到0.670与0.725,均优于所有基线模型。在药物毒性属性预测中,hERG心脏毒性预测F1分数达0.872、准确率达0.829,Ames致突变性F1分数达0.676,LO2细胞毒性准确率达0.861,均取得最优或次优结果,满足虚拟筛选对预测精度与召回率的双重要求。模型输出结果可直接用于对候选化合物库进行高通量ADMET性质评分排序,支撑早期药物筛选决策。

5 专利转化成效

相关技术成果已进入实质转化与权属固化阶段。

深度森林公司与该国家级新药筛选中心围绕“基于图注意力网络的多源异构数据药物ADMET分类预测”核心技术体系,已完成1项国家发明专利与2项软件著作权的组合申请与布局。预测算法已部署至该中心虚拟筛选平台,后续拟结合该中心三个在研新药管线开展规模化虚拟筛选示范应用,预期可将ADMET评价阶段候选化合物初筛效率提升80%以上,大幅降低实验验证成本,为加速先导化合物优化、提升新药研发成功率提供关键技术支撑。

山东深度森林信息科技有限公司是一家面向高质量专利“挖掘-设计-转化”的技术服务团队。

http://www.jsqmd.com/news/800847/

相关文章:

  • 3分钟搞定B站视频转文字:从零到精通的实战指南
  • 别再死记硬背了!用Python+NumPy可视化理解OFDM与SC-FDMA的核心差异
  • 2012汽车电子技术趋势:车联网、材料革新与高性能控制设计
  • 微型环境传感器技术:PM2.5与VOC检测的突破与应用
  • Flutter 轻量存储方案介绍、区别、对比和使用场景
  • 面试官:5年经验还不懂箭头函数?
  • 基于SpatiaLite与React的英国邮编空间搜索应用架构与实战
  • Windows 环境下 Claude Code 安装与配置完全指南(含国产模型切换)
  • OpenClaw 长期使用避坑指南:环境稳定性维护、数据备份策略、版本兼容处理全方案
  • Windows 11安卓子系统WSA终极指南:开发者问题与功能请求完整解析
  • Intelli开源智能代理框架:从核心概念到生产部署全解析
  • 仅剩72小时可获取的2026终极对比手册(含Prompt工程调优参数表、国产信创环境适配补丁包、等保2.0三级适配验证清单):ChatGPT与Gemini,你选错一个就多花237万年运维成本
  • nv-design:自动化搭建设计师与前端开发者的本地工具链
  • 短视频矩阵系统技术选型:从自研到 SaaS 的成本与收益分析
  • WPF动画避坑指南:Blend路径动画Canvas.Left与RenderTransform的实战选择(附性能对比)
  • 终极指南:如何用GHelper轻松管理华硕笔记本性能与电池健康
  • 规划求解(Solver)实战:利用Excel的Solver工具进行投资组合优化
  • DownKyi音视频分离技术解析:从容器格式到素材提取的专业实践
  • 你做RAG,错在第一步
  • skillpm包管理器:下一代依赖管理工具的设计原理与实战指南
  • 2026年4月硅胶布供应商推荐,灭火毯/高硅氧布/锂电池灭火毯/芳纶布/石英布/高硅氧纤维/保温套,硅胶布供应商哪家可靠 - 品牌推荐师
  • 为什么92%的AI团队Serverless化失败?奇点大会披露的4个反直觉架构断点与实时熔断方案
  • 从SRT算法到现代CPU:为什么你的处理器除法这么快?
  • 高频电路实战:基于Multisim的调幅发射机设计与调试全解析
  • 从游戏角色到人脸分析:聊聊‘摇头、点头、转头’背后的欧拉角与万向节死锁
  • AI驱动的产品探索副驾:如何用系统提示词实现高效用户研究
  • 别再为ESXi证书错误头疼了!巧用Nginx反向代理+FRP,实现HTTPS域名安全访问内网后台
  • FastAPI 最佳实践:构建高性能电商后端
  • 金融/医疗/政务场景紧急适配!SITS 2026 v1.0已开放首批200个白名单接入名额(含FATE兼容桥接器与GDPR合规审计模板)
  • 基于RAG构建生产级知识问答系统:从架构设计到实战优化