当前位置: 首页 > news >正文

清华智源研究成果登《Science》:DrugCLIP用AI驱动百万倍速药物筛选,开启全基因组靶向时代

在计算生物学领域,有一个被追逐了数十年的“圣杯”——化学基因组学。其核心愿景是实现对全基因组蛋白质靶点的全覆盖,为每一个潜在的生命密码配上一把精准的“药物钥匙”。人类基因组编码约 20000 种蛋白质,其中 90% 与疾病密切相关,却长期处于 “无药可靶” 状态。面对如此庞大的潜在靶点空间与近乎无限的小分子化学库,传统药物筛选方法如同大海捞针,即使依靠当前最先进的分对接工具,完成全基因组规模的筛选也需数百年,严重制约了突破性疗法的发现。

1月9日,清华大学智能产业研究院(AIR)- 北京智源人工智能研究院“健康计算联合研究中心” 兰艳艳教授课题组的主导下,研发的AI 驱动的超高通量药物虚拟筛选平台 DrugCLIP,在顶刊《Science》重磅发表。DrugCLIP不仅实现了药物筛选速度的百万倍级提升,更首次完成了全基因组规模的药物映射,将化学基因组学的宏伟梦想照进现实。兰艳艳系清华大学智能产业研究院(AIR)教授,智源学者,青源会发起成员。


范式重构:从“物理模拟”到“跨模态向量检索”的技术跃升

传统药物筛选长期受困于“不可能三角”:精度、通量与化学空间规模。传统的分子对接高度依赖原子级的物理受力模拟,面对万亿级分子库时,庞大的计算代价让全基因组筛选成了不可能完成的任务。


DrugCLIP 的核心创新在于创造性地构建了蛋白质口袋与小分子的“向量化结合空间”。它不再执着于模拟分子如何“卡入”蛋白的动态过程,而是利用深度对比学习技术,将复杂的生物相互作用重构为计算机领域极度成熟的向量检索问题。

在这种硬核架构下,团队展现了极具前瞻性的 AI 逻辑:

  • 自监督结构预训练: 团队创造性地从海量蛋白数据中切取片段模拟“假配体”,构造了多达 550 万组 训练样本。这种策略让 AI 在接触真实药物前,就已深刻领悟了蛋白表面的结构特征,赋予了模型极强的 Zero-shot泛化能力。

  • 多尺度表征对齐: 团队通过训练两个深度神经网络编码器,将蛋白口袋的 3D 拓扑结构与小分子的化学表征映射到同一个高维共嵌入空间(Joint Embedding Space)。

这种算法级的范式转换,直接将单节点(128核 CPU + 8张 GPU)的日打分能力推向了 10 万亿次(10的13次方) 的巅峰。相较于传统工具,筛选效率提升了 100 万倍。

从预测到验证:攻克“暗靶点”与 AlphaFold 结构的无缝对接

DrugCLIP 的价值不仅在于算力的飞跃,更在于其对全新靶点的硬核筛选能力。针对此前既无实验结构、也无已知抑制剂的“暗靶点”——人源 E3 泛素连接酶 TRIP12(与癌症和帕金森相关),DrugCLIP 直接基于 AlphaFold2 预测的蛋白结构进行盲筛,成功命中多个活性抑制剂。


在临床靶点 NET(去甲肾上腺素转运体)的实验中,DrugCLIP 筛选出的候选分子中有 15% 证实有效,且部分分子的活性直接超越了现有的一线临床药物。相关复合物结构已通过冷冻电镜解析,进一步验证了其生物学可信度。


赋能万众创新:开启基因组级药物发现生态

为了践行赋能科研社区、重塑药物研发现状的愿景,研究团队利用 DrugCLIP 完成了人类历史上首次全基因组规模的虚拟筛选:覆盖约 1 万个蛋白靶点、2 万个结合口袋,对超过 5 亿个小分子进行全量对齐,产出 200 万个高潜力靶点分子对,并据此构建了目前全球规模最大的蛋白-配体筛选数据库GenomeScreenDB。


早在 2025 年 6 月,清华 AIR 已联合智源研究院预先发布了 DrugCLIP 平台,正式向全球科研社区免费开放。截至目前,该平台已吸引了超过千余名科研人员深度使用,累计完成了超过万次大规模筛选任务。 这种极速、低门槛的筛选体验,正在极大地降低新靶点开发的起始门槛。


针对这一划时代的成果与平台的开放,北京生命科学研究所所长、中国科学院院士王晓东评价道:

“DrugCLIP 大大提高药物发现的速度,不仅仅是时效的提升,更大的作用是扩展候选化合物的空间,降低了制药的门槛,为万众创新提供了可能,为新药研发创造更好的生态环境。AI 药物研发更有意义的应用场景是发现新的可药靶点。”

DrugCLIP在《Science》的发表,不仅是对技术突破的国际认可,更意味着药物研发正式迈入“后AlphaFold时代”的规模化、系统化新阶段。从孤立靶点攻关到全景化探索,从封闭研发到开放协作,DrugCLIP作为AI4S(AI for Science)重塑生命科学底层逻辑的绝佳范例,正在重新定义药物发现的路径与边界,推动人工智能成为下一代医疗突破的核心驱动力。

论文地址:https://www.science.org/doi/10.1126/science.ads9530

DrugCLIP 平台地址: https://www.drugclip.com

DrugCLIP 实现了从“大海捞针”到“精准定位”的筛选突破,在速度与规模上取得了重大进展。在此基础之上,进一步提升靶点与药物分子匹配的精度、推动药物从筛选到设计的全链条贯通,成为接下来的关键方向。

承接这一方向,北京智源人工智能研究院自主研发了全原子微观生命模型OpenComplex2,旨在药物筛选的精度和机理层面做进一步的深化探索。OpenComplex2实现了药物筛选从静态结构预测走向动态构象全景建模,通过预测自由能景观的方式,清晰描绘靶点与药物分子间的动态作用的全貌,为候选分子的微观机理验证与结构优化提供理论依据,有望加速从基础分子机制研究向临床药物设计的转化。

未来,DrugCLIP的广度筛选与OpenComplex2的深度模拟将形成合力,与科研产业生态合作伙伴深度协同,共同推进在肿瘤、感染性疾病、罕见病等领域的新靶点与First-in-class药物的发现,助力构建更智能、高效、普惠的全球药物创新生态。

http://www.jsqmd.com/news/235191/

相关文章:

  • windows显示隐藏的“文件夹”和文件
  • 什么是OLC(CPU过载控制)
  • 大模型算法工程师年薪百万,这可能是你最好的职业选择_今年大模型这工资是认真的吗?
  • 在trae、qoder、Claude Code、Cursor等AI IDE中使用ui-ux-pro-max-skill
  • 三菱Q型PLC在4轴伺服定位及控制中的应用:QD75MH4定位、触摸屏及PLC程序技术资料
  • 做了个工具可以帮你录制任意网页操作并快速转为可以给大模型调用的 MCP
  • ruoyi 新增每页分页条数
  • ESP8266生成二维码算法 OLED显示 支持各种平台移植 算法部分采用c语言,可以移植到各...
  • 深度测评自考必备AI论文平台TOP8:选对工具轻松写完毕业论文
  • 部分离线强化学习相关的算法总结(td3+bc/conrft)
  • 上手实操 | Dense Bev 融合优化方案
  • 西门子PLC 和v90 伺服变频器G120通讯 2台西门子变频器G120 Profinet通讯
  • 【收藏必备】大模型微调入门到精通:原理、优势与PEFT技术详解
  • 西门子200 Smart PLC与昆仑通态触摸屏的脉冲除尘器程序(20仓x12阀,手动自动控制...
  • 基于微信小程序的家乡特产销售平台-计算机毕业设计源码+LW文档
  • 高频信号处理篇---鉴频
  • 基于Java的家政服务平台的设计与实现毕业论文+PPT(附源代码+演示视频)
  • 汽车平顺性实战:从悬架振动到路面反演
  • 扫地机器人路径规划问题,算法是全覆盖内螺旋算法,使用MATLAB实现,下列为运行图过程截图
  • 海洋综合治理空间智能平台专项建设方案——基于空间视频感知与动态三维重构的海域治理技术路径
  • Springboot上门护理服务预约系统3hx0u(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • 综合治理空间智能平台建设总方案——基于空间视频感知与统一空间智能底座的协同治理技术路径
  • 咱们今天聊点硬核的——用VB.NET直接操控三菱变频器。这玩意儿在工厂自动化里可是刚需,特别是需要精准控制电机转速的场景。废话不多说,直接上干货
  • 高频信号处理篇---鉴相
  • 带薪追剧的快乐,被这些 10 分钟短剧承包了
  • 腾讯房地产广告投放公司 朋友圈房产广告投放合作 朋友圈房产广告推广流程
  • 港口综合治理空间智能平台专项建设方案——人–车–船–设备一体化的空间视频智能治理技术路径
  • 玩过电机的都知道,BLDC控制最刺激的就是在无传感和有传感之间反复横跳。今天带大家扒一扒基于STM32F1的这套双料方案,手把手看代码怎么把电机治得服服帖帖
  • (新卷,100分)-数大雁(JavaPythonJSC++C)
  • HMI信息架构设计:四层金字塔模型——构建符合认知负荷的高效界面