当前位置: 首页 > news >正文

港科大:再探可解释虚拟细胞蓝图

虚拟细胞是通过计算机模拟生物细胞分子功能、过程乃至整体行为的虚拟模型。历史上,细胞建模工作多依赖「规则驱动」的机械论模型,这类模型可解释性强,但难以规模化。然而,近年来「组学」数据(尤其是单细胞分辨率数据)的爆发式增长,已推动细胞建模领域向「数据驱动」的人工智能(AI)框架转变。这与AI领域的广泛范式转移相呼应——符号化、规则驱动的逻辑已在很大程度上被神经网络取代。这些现代模型具备前所未有的预测能力,但对「黑箱」架构的依赖,引发了新的问题:如何平衡数据驱动的性能与机械论方法的生物物理透明度。

2012年,Karr等发表了篇具有开创性的论文A whole-cell computational model predicts phenotype from genotype。在这项研究中,作者构建了生殖道支原体(1种拥有已记录的最小自由生活生物基因组的细菌)的全细胞模型,该模型能准确预测代谢活性、基因表达及细胞增殖累积行为。为实现这一目标,研究团队首先对生殖道支原体基因组进行了详细注释——这本身就是项艰巨的任务——随后基于注释设计了对应特定生化或生物物理过程的细胞模块。每个模块由「子模型」构成,这些子模型采用适配的数学框架(例如常微分方程、泊松过程和通量平衡分析)描述模块的不同部分,并通过共享的细胞状态变量以「输入-输出-输入」的方式相互连接。例如,「转录」是个细胞模块,包含多个子模型,通过数学方法描述参与转录的不同分子组件的活性:1个子模型以转录因子浓度为输入,模拟蛋白复合物形成速率(输出);该输出随后成为另1个子模型的输入,该子模型还可能纳入基因拷贝数作为第2个输入,以预测转录本拷贝数(输出),依此类推。在这个例子中,基因拷贝数、转录因子浓度和蛋白复合物浓度均为基于真实实验测量初始化的细胞变量;其适配的数学框架也基于对每个过程的机械论理解进行选择。

这一切中最具挑战性的部分,是将所有共享大量细胞状态变量的子模型串联起来,构建1个集成化(且理想状态下稳定的)全细胞模型。对于具备数学基础的读者而言,该全细胞模型的运作方式类似于常微分方程组的数值积分,其中28个细胞过程作为控制方程,各类细胞状态作为对应的状态变量。

作为对模型的初步验证,作者将模拟细胞与建模过程中未使用的真实数据集进行了对比。例如,他们发现对于特定基因hmw2,128个模拟细胞中mRNA丰度与蛋白丰度的分布及相关性,与1项独立研究的真实单细胞测量结果相符。该团队还开展了其他多项验证研究,但最令我印象深刻的是其预测细胞生长增殖必需基因的能力。具体而言,对生殖道支原体525个基因分别进行计算机内敲除后,该模型预测细胞生长速率的准确率达79%。为探究预测不准确的原因,作者开展了真实的敲除实验,发现有4个基因的实验结果与模型预测不一致。通过对生殖道支原体基因组的进一步研究,作者发现其他一些基因的蛋白产物似乎具有次级功能,可补偿受扰动基因的功能,从而导致实验结果出现差异。基于这一发现,作者利用模型预测了该次级功能的催化速率,展示了模型在发现和表征先前未知蛋白功能方面的应用,最终实现了更准确的模型预测。这些验证及后续实验完美凸显了完全可解释细胞模型的优势:不仅能预测,还能解释。

13年后重新回顾这项研究,仍然是细胞建模领域的杰作——尤其是考虑到当时的计算是在仅配备16-64GB随机存取存储器的服务器上完成的,且基于图形处理器的计算才刚刚起步。该模型未涉及任何机器学习,而是在指导虚拟细胞内部运作的物理规则基础上,构建了1个精心整理的知识驱动型细胞架构。这种原始虚拟细胞所具备的高度知识驱动、机械论的特性,仅能通过详细的基因组注释、选择性纳入子模型,以及基于文献精心整理每个子模型的方程和参数(这通常需要协调相互冲突的信息)来实现。

近年来的虚拟细胞研究已完全摒弃了这种可解释性方法,转而采用完全数据驱动AI习得的模型,这些模型利用现代计算硬件、神经网络和海量单细胞数据集。不禁思考,在AI构建虚拟细胞的时代,机械论方法是否还有立足之地?或许最终的解决方案将是一种混合方法——既利用大规模AI模型的优势,又结合精心整理的实验数据集及后续测试周期,旨在构建更具可解释性的生物学基础模型。

#虚拟细胞 #可解释性 #细胞建模 #机械论模型 #人工智能 #数据驱动模型 #全细胞模型 #基因型表型预测

angelawu@ust.hk

详细总结

思维导图(mindmap脑图)

模型核心架构

核心差异

参考

Nat Rev Genet. 2026 Feb 5. doi: 10.1038/s41576-026-00940-8.

Revisiting the blueprint for an interpretable virtual cell

260205AIVC.pdf

注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。

http://www.jsqmd.com/news/634156/

相关文章:

  • Windows APK文件管理的终极解决方案:告别混乱,拥抱高效
  • YOLO12应用指南:如何将最新目标检测模型融入你的项目
  • 【uni-app踩坑录】scroll-view时而滚不动、时而卡死?彻底解决Flex布局下的高度冲突问题
  • 系统启动与基础命令
  • 如何构建高效QQ机器人:go-cqhttp技术深度解析与实战指南
  • 存储那么贵,何不白嫖飞书云文件空间匮
  • 如何用Tomodoro网页番茄钟终结分心困扰:3步打造高效专注工作流
  • Linux-编译器
  • ReadCat开源小说阅读器:从入门到精通的完整实战指南
  • 【异常】安装hermes-agent.git提示error: RPC failed; curl 56 OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 110
  • 万物识别模型部署全攻略:环境配置+代码运行,新手必看
  • imagemagick6.2.7 批量处理nscripter的绿幕立绘到透明png的教程
  • 实测阿里Qwen-Image-2512镜像:ComfyUI操作,生成效果惊艳
  • 龙芯k - 走马观碑组MPU驱动移植啃
  • 热议知名的建筑节能改造企业,哪家靠谱选它不踩坑 - 工业品网
  • 2026年Ei 检索核心期刊目录(最新版)
  • PDE (Processing D Editor) 三维场景编辑器 · 软件白皮书 · 基于 v..境
  • Omni-Vision Sanctuary 跨平台开发:利用WSL2在Windows下进行模型调试
  • Gemma-3 Pixel Studio效果展示:PNG透明通道保留下的精准前景物体识别
  • 密码学工具箱ToolsFx:新手也能快速上手的终极指南 [特殊字符]
  • 总结鹅绒被源头工厂排名,说说性价比高的鹅绒被品牌怎么选 - 工业设备
  • nli-distilroberta-base嵌入式设备展望:从STM32到边缘AI的轻量化之路
  • Minecraft Region Fixer终极指南:拯救你的损坏游戏世界
  • UniApp权限管理进阶:用uni-popup优雅实现权限申请前的目的告知(兼容安卓13+)
  • 写代码易错点整理
  • 终极指南:DeepSeek-OCR如何通过SAM+CLIP双编码器实现高精度文档识别
  • 从“实体分类学”到“关系语法学”:DOS模型的理论品格与未来潜能
  • 2026奇点大会倒计时92天!AIAgent开发入门黄金窗口期:掌握这6个可复用Agent模式,抢占首批企业落地席位
  • ESP32与LVGL实战:高效图片显示方案解析
  • DeepSeek-OCR:视觉压缩如何重塑长文本处理?解析DeepEncoder的架构设计与效率突破