当前位置：首页 > news >正文

耶鲁：多智能体驱动的虚拟细胞模型设计

news 2026/7/5 5:34:53

摘要

虚拟细胞建模旨在预测细胞对多种扰动的响应，但面临生物复杂性、多模态数据异质性及跨学科专业知识需求等挑战。本研究提出多智能体框架CELLFORGE，可自主设计并合成针对特定单细胞数据集和扰动任务的神经网络架构。给定原始多组学数据和任务描述，CELLFORGE通过专业智能体间的协作推理发现候选架构，随后生成可执行实现方案。核心贡献在于该框架本身：研究表明，相较于人工设计或单大语言模型提示，多智能体协作机制能够自主产生可执行、高质量的计算方法。该方法超越了传统超参数调优，通过智能体deliberation自主涌现出全新的架构组件（如轨迹感知编码器和扰动扩散模块）。在涵盖基因敲除、药物处理和细胞因子刺激的６大数据集上对CELLFORGE进行评估，涉及多种模态（单细胞RNA测序、单细胞染色质可及性测序、单细胞蛋白组学测序）。结果表明，CELLFORGE生成的模型与现有基线模型具有高度竞争力，同时揭示了系统性的架构创新模式。CELLFORGE凸显了多智能体框架的科学价值：专业智能体间的协作能够实现单一智能体或人类专家无法达成的真正方法学创新和可执行解决方案。这标志着计算生物学领域向自主科学方法开发的范式转变。

代码已开源（https://github.com/gersteinlab/CellForge）

#虚拟细胞模型 #多智能体框架 #单细胞扰动预测 #神经网络架构 #人工智能 #单细胞多组学

xiangru.tang@yale.edu

zhuoyun.yu@yale.edu

jiapeng.chen@yale.edu

mark.gerstein@yale.edu

引言

图1

(a) 扰动预测学习高维表达空间中从对照细胞状态到扰动后状态的映射；

(b) 模型在多种模态（单细胞 RNA 测序、单细胞染色质可及性测序、单细胞蛋白组学测序）中基于对照 - 扰动细胞对训练，以预测未见过的扰动响应；

(c) CELLFORGE 接收数据集和任务描述，自主设计用于预测新型扰动下表达的模型（pi∈Ptest）；

(d) 系统工作流程

材料与方法

设计模块

图2多智能体协作生成科学研究产物

任务分析模块生成数据集表征和基于文献的见解，设计模块通过结构化智能体讨论合成新型方法学方案，实验执行模块展示代码生成能力

多专家评论系统

图3CELLFORGE架构与工作流程

图基讨论

图4图基讨论架构与工作流程

这是初始2轮讨论的示例，每轮后更新置信度评分，智能体系统判断当前状态是否满足停止标准；若不满足，每位专家将根据评论智能体的建议和其他专家的观点完善思路，该图基评论完善过程持续至达到终止状态。图中包含基于历史评分、同行评估和评论智能体评估的加权组合计算每位专家每轮置信度评分的示例公式

验证、完善与输出保证

图5图基专家讨论中的置信度评分更新

该图展示了领域专家的置信度评分在图基专家讨论框架的迭代轮次中如何演变，虽以模型架构专家为例，但该置信度更新过程适用于图中所有参与讨论的专家，每位专家都会通过多轮讨论迭代完善其提案并根据多智能体评估调整置信度

结果

预测性能

表1多现有基线模型可用数据集上的扰动后基因表达预测结果

CELLFORGE模型的报告指标为3个自动设计模型的均值 ± 标准差；排名标记基于最佳边界确定：指标值越低越好时，采用均值 - 标准差；指标值越高越好时，采用均值 + 标准差。所有基线方法均在对应数据集的未见过扰动设置下复现

生物学验证

表2各基准数据集上的差异表达基因（DEG）恢复性能

任务分析模块与设计模块的大语言模型评估和人类评估

图6手动提示4种不同的 DeepResearch 变体、Biomni 和单大语言模型（Claude 3.7）生成研究计划，随后由5个独立大语言模型从8个维度进行评估，评分范围为 1-10

新型架构发现

图7CELLFORGE在单细胞RNA测序基因敲除扰动预测任务中设计的模型框架示例

检索有效性

图8CELLFORGE的检索增强生成（RAG）与标准RAG方法的性能对比

(1) hal：幻觉检测；

(2) rel：上下文相关性；

(3) utl：上下文利用率。

结果按扰动类型（药物、细胞因子、基因）分层

组件贡献

表3关键框架组件对设计模型性能影响的消融研究

详细总结

思维导图（mindmap）

核心模块设计（关键组件）

性能优势（对比现有基线）

参考

CellForge: Agentic Design of Virtual Cell Models

https://doi.org/10.48550/arXiv.2508.02276

260204CELLFORGE.pdf

注：AI辅助创作，如有错误欢迎指出。内容仅供参考，不构成任何建议。

http://www.jsqmd.com/news/484773/

相关文章：

基于yolov8的齿轮缺陷检测系统，支持图像、视频和摄像实时检测【pytorch框架、python源码】

OpenClaw 超级 AI 实战专栏【基础操作与核心概念】（五）日志怎么看：正常日志、警告、报错区分

零基和一基

【AI】Mac 安装 OpenClaw 及接入飞书教程

CAR-bench: Evaluating the Consistency and Limit-Awareness of LLM Agents under Real-World Uncertainty

【AI游戏】Unity Barracuda神经网络推理

FAITHEVAL: CAN YOUR LANGUAGE MODEL STAYFAITHFUL TO CONTEXT, EVEN IF “THE MOON ISMADE OF MARSHMALLO

企业AI智能体进入“人机协作”新阶段：数字员工与人类员工的“混合劳动力”时代

2026年工业GEO/抖音运营营销服务商推荐指南 - 资讯焦点

2025_NIPS_SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

Python爬虫实战：构建高可用静态网页爬虫 - 以 Quotes 网站数据采集为例！

【AI游戏】Unity ChatGPT对话集成

如何通过正规平台高效完成沃尔玛购物卡回收和变现？ - 团团收购物卡回收

企业 AI 智能体：从 Demo 到规模化落地的技术架构与工程实践

Python爬虫实战：基于 Python 的多版本文档差异自动化追踪系统！

2026无锡AI优化公司/抖音运营推荐榜精准触达核心人群 - 资讯焦点

【LLM进阶-Agent】5. Plan Execute Agent 介绍

2026年敦煌口碑好的旅行社排名，天佑国际旅行社旅游服务靠谱吗 - mypinpai

C#常用类库-详解JetBrains.Annotations

Go 提案解读：heap/v2 —— 泛型堆终于来了！

华南诚信物流劳务派遣分包机构推荐榜 - 优质品牌商家

2026无锡GEO优化/ai优化服务商推荐榜精准触达工业客群 - 资讯焦点

C++面对对象

【即梦AI提示词】生图提示词推荐

探讨标远精工加工中心详细介绍，其价格多少钱合适 - 工业推荐榜

SecGPT-14B开源可部署：云起无垠发布首个专注网络安全的14B大模型

OpenClaw橙皮书

2026特殊场合轻奢高跟鞋优质品牌推荐 - 资讯焦点

ZooKeeper集群搭建

AC2100 OpenWrt 多账号单线多拨实战指南