当前位置: 首页 > news >正文

Nat Commun|吴华君/徐明团队开发跨尺度三维基因组预测深度学习框架Hi-Compass

染色质三维结构通过构建远端调控元件之间的空间互作精细调控基因转录,在决定细胞身份、组织发育和疾病发生等生物学过程中扮演重要角色【1–3】。基于染色体构象捕获(3C)的Hi-C技术实现了全基因组尺度染色质互作图谱的绘制,并陆续揭示了A/B compartment、拓扑关联结构域(TAD)以及染色质环(chromatin loop)等人类基因组折叠的基本规律及其在发育、疾病和衰老过程中的作用【4,5】。然而,高质量Hi-C图谱的产出对样本量、测序深度和实验成本均有较高要求,尤其在单细胞与空间尺度上,Hi-C数据的获取仍存在显著瓶颈。

为缓解这一问题,近年来相继出现了多种基于深度学习的Hi-C图谱预测方法,如Akita、C.Origami、Epiphany、ChromaFold等。然而,当面向单细胞与空间组学数据时,现有方法仍存在多方面的局限:(1)训练需要同一样本同时具备ATAC-seq、CTCF ChIP-seq等多组学输入;(2)难以泛化到未见过的细胞类型;(3)未充分考虑单细胞与空间数据中固有的稀疏性和测序深度的高度异质性。

针对上述挑战,2026年4月14日,北京大学临床医学高等研究院(细胞稳态与衰老性重大疾病北京研究中心)/北京大学肿瘤医院吴华君、北京大学第三医院徐明和北京大学肿瘤医院王玉娟共同通讯在 Nature Communications 上发表了题为 Hi-Compass: a depth-aware deep learning framework for predicting cell-type-specific 3D genome organization from single-cell to spatial resolution 的研究论文,提出了一个跨测序深度的三维基因组预测深度学习框架Hi-Compass,能够从ATAC-seq数据出发,跨bulk、单细胞、空间等多尺度预测细胞类型特异性的Hi-C接触图谱。

文中提出的Hi-Compass是一个基于CNN-Transformer架构的深度学习框架,以ATAC-seq信号为唯一的细胞类型特异性输入,结合DNA序列、泛细胞类型CTCF结合谱以及ATAC-seq的测序深度,预测细胞类型特异性的Hi-C接触图谱。为兼容bulk、单细胞和空间组学中差异极大的测序深度,作者在训练阶段引入多种测序深度的ATAC-seq输入,并通过深度嵌入(depth embedding)将当前输入的测序深度告知模型,使其在不同数据尺度下均可生成合理预测。

在此基础上,作者将Hi-Compass与Akita、C.Origami、Epiphany、ChromaFold等代表性方法进行了系统性benchmark比较,在Hi-C图谱整体相关性、高置信染色质环的恢复、以及TAD边界与insulation score一致性等多个维度上评估了各方法的预测性能,结果显示Hi-Compass在跨细胞类型泛化场景中的预测精度优于现有方法。在多细胞类型联合训练策略下,Hi-Compass对训练集之外的细胞类型同样具备zero-shot预测能力。

进一步地,作者将Hi-Compass应用于外周血单核细胞(PBMC)的scATAC-seq和胚胎心脏发育的multiome数据集,解析了不同免疫细胞亚群与发育阶段细胞类型特异性的染色质互作图谱。基于所预测的细胞类型特异性染色质环信息,Hi-Compass进一步支持将GWAS非编码变异系统性地连接到其候选靶基因,为复杂疾病的功能解读提供了三维基因组学视角。

在空间尺度上,作者将Hi-Compass接入spatial ATAC-seq数据,在人类海马组织中实现了空间分辨的染色质互作预测,刻画了组织空间位置与细胞类型特异性三维基因组结构的对应关系。此外,作者通过对小鼠基因组的fine-tuning进一步展示了Hi-Compass的跨物种应用能力。

综上,该研究工作为细胞类型特异性三维基因组预测提供了一个覆盖bulk—单细胞—空间多尺度并支持跨物种应用的统一深度学习框架。Hi-Compass的提出将有力推动三维基因组学在发育、免疫、神经及疾病研究中的广泛应用,并为非编码遗传变异的功能解读提供新的工具。

本论文的共同通讯作者为北京大学临床医学高等研究院(细胞稳态与衰老性重大疾病北京研究中心)/北京大学肿瘤医院吴华君研究员、北京大学第三医院徐明教授和北京大学肿瘤医院王玉娟博士;北京大学肿瘤医院孙源辰、北京大学第三医院蒋文杰和北京大学肿瘤医院蔡康文为本文的共同第一作者。

原文链接:https://www.nature.com/articles/s41467-026-71877-z

制版人: 十一

参考文献

1. Bonev B, Cavalli G. Organization and function of the 3D genome. Nature Reviews Genetics 2016, 17:661–678.

2. Dekker J, Mirny L. The 3D genome as moderator of chromosomal communication. Cell 2016, 164:1110–1121.

3. Hafner A, Boettiger A. The spatial organization of transcriptional control. Nature Reviews Genetics 2023, 24:53–68.

4. Lieberman-Aiden E, et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 2009, 326:289–293.

5. Rao SSP, et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell 2014, 159:1665–1680.

最全1000+植物核基因组数据库IMP (点击图片直达)

高颜值免费 SCI 在线绘图(点击图片直达)


往期精品(点击图片直达文字对应教程)

LinuxPython

R绘图NGS基础GEO高级

生信自学生信书籍系列教程心得体会

转录组经典宏基因组蛋白质组单细胞系列测序发展史

免费在线画图色彩搭配图形排版图形解读

ChIP-seqTCGAGSEAWGCNA

海哥组学傻瓜系列文章写作

CytoscapeExcelPPT

机器学习

公众号投稿联系:陈同 (chentong_biology@163.com)

http://www.jsqmd.com/news/755681/

相关文章:

  • 别再死磕复杂模型了!用TuckER张量分解搞定知识图谱补全,附PyTorch代码实战
  • 【2026年唯一认证级OPC UA C#开发手册】:覆盖IEC 62541-4/5/8/13全标准,附12个工厂产线实测案例源码
  • 基于Next.js 15与Prisma的AI智能体管理系统:规范驱动开发实践
  • 测试系统开发全流程:硬件架构与软件设计实战
  • 深入探讨:解决Azure AD B2C用户管理中的NullReferenceException
  • AI机器人产业全景与发展态势
  • NVIDIA Nemotron Nano V2 VL模型:边缘计算中的视觉语言模型实践
  • Power Apps上传文件到SharePoint时,Base64转换和JSON解析的坑我都帮你踩过了
  • 5个步骤轻松实现Unity游戏自动翻译:XUnity.AutoTranslator完全指南
  • 别再只会用梯度下降了!用Scipy的basinhopping搞定Python里的那些‘坑’函数
  • 车载C#中控与ADAS域控制器通信卡顿?(揭秘DDS over .NET 6 + ROS2 Bridge的混合通信架构,已通过AEC-Q100 Grade 2验证)
  • 别再只会JSON.stringify了!JS对象Key重命名的7种实战方案(含性能对比)
  • 向量模型分词与截断机制详解:从文本到向量的完整旅程
  • LoRA-Torch:权重合并范式实现通用高效的大模型微调
  • 为什么说Godot-MCP正在彻底改变游戏开发的工作方式?
  • STM32F103C8T6小车蓝牙遥控避坑指南:HC-05模块AT指令配置与串口中断实战
  • 深度解析YoRadio:ESP32音频流媒体系统的架构设计与实现机制
  • 自优化视频采样技术提升物理真实感
  • 别再只调SystemInit了!STM32从Stop模式唤醒后时钟配置全解析(HSE恢复72MHz)
  • 推理服务为什么一开超时熔断就开始误杀长输出:从 Token Budget 到 Partial Result Commit 的工程实战
  • 从‘错题本’到OHEM:聊聊目标检测中困难样本挖掘的演进与最佳实践
  • 远程固件级调试不再难,.NET 9边缘调试全链路打通,从ARM Cortex-M到Linux容器一文吃透
  • Shimmy:一键部署本地OpenAI兼容服务器,无缝接入GGUF模型
  • 3步掌握B站视频下载:downkyi高效下载工具全攻略
  • 深入浅出 MCP (Model Context Protocol): 开启 AI Agent 的标准化连接时代
  • Debian 12虚拟机安装避坑指南:从DVD离线安装到配置清华源,保姆级全流程
  • NVIDIA Nemotron Nano V2 VL视觉语言模型解析与应用
  • 效率提升秘籍:用快马AI自动生成黑马点评项目通用工具类与模块
  • vscode的tunnel链接(Linux 服务器 + Windows 本地电脑版本)
  • 新手入门:通过快马ai生成第一个winutil工具理解gui与系统交互