当前位置: 首页 > news >正文

西交大:多组学生存分析

作者总结

提出了1款基于协同Transformer的分析框架CoFormerSurv,可利用多组学数据提升生存预测的准确性。该方法包含2个互补的核心模块:❶ 组间Transformer,用于对跨组学交互作用进行建模;❷ 样本间图Transformer,用于学习多组学样本间的邻域关系。通过整合这2个研究视角,构建的双Transformer架构能够实现更全面的特征学习,相较于现有方法展现出更优的性能。

摘要

在生物医学领域,高通量测序技术的发展产生了海量的高维多组学数据。基于多组学数据的生存分析方法能从多个视角全面揭示疾病的异质性与复杂性,进而提升患者预后预测的准确性,这对精准医学中个性化治疗方案的制定至关重要。近年来,Transformer架构已成为多个领域的主流范式,但由于右删失数据建模存在固有挑战,如何将Transformer架构有效应用于多组学生存分析,充分挖掘不同组学间的互补信息以提升生存预测性能,目前仍未明确。本研究提出1种创新的用于多组学生存分析的协同Transformer框架CoFormerSurv,该框架包含组间Transformer和样本间图Transformer两个串联的Transformer架构。组间Transformer通过多头自注意力机制学习多种有意义的特征交互关系,捕捉并量化不同组学间的互补信息;样本间图Transformer则将融合后的多组学图结构信息整合至Transformer架构中,能更高效地挖掘样本间的邻域关系。2种Transformer架构协同工作,生成更全面的多组学特征,从而提升Cox比例风险模型在生存分析中的性能。在多个真实数据集上的实验结果表明,该方法通过同时挖掘组间和跨样本视角的互补信息,性能优于单Transformer架构及现有各类生存预测模型。

Figshare

https://doi.org/10.6084/m9.figshare.30744665

GitHub

https://github.com/LiminLixjtu/CoFormerSurv

liminli@mail.xjtu.edu.cn

#多组学 #生存分析 #Transformer #Cox比例风险模型 #生物信息学 #特征融合

结果

CoFormerSurv模型概述

图1所提出的CoFormerSurv模型架构概述

组间Transformer通过多头自注意力机制识别多组学数据间的高阶交互特征;样本间图Transformer将融合后的多组学图结构信息编码至Transformer架构中,对组间Transformer提取的多组学特征进行聚合,以学习更具表达性的样本嵌入特征。协同Transformer整合组间Transformer与样本间图Transformer,生成更具信息性和判别性的多组学特征,用于基于Cox比例风险模型的生存分析。

与现有方法的性能对比

表1CoFormerSurv模型与现有方法的C指数性能对比

表格上半部分为单组学方法在基因/微RNA表达数据上得到的C指数值,下半部分为多组学方法的对应结果;最右侧列汇总了各方法在所有癌症数据集上的平均C指数值。最优和次优结果分别以粗体和下划线标注。

表2CoFormerSurv模型与现有方法的受试者工作特征曲线下面积(AUC)值对比

表格上半部分为单组学方法在基因/微 RNA表达数据上得到的AUC值,下半部分为多组学方法的对应结果;最右侧列汇总了各方法在所有癌症数据集上的平均AUC值。最优和次优结果分别以粗体和下划线标注。

图2 基于Cox比例风险模型的各类方法在乳腺癌(BRCA)数据集上预测的高低风险组卡普兰-迈耶生存曲线及对应的对数秩检验P值

消融实验

表3 CoFormerSurv模型及关键组件消融后的变体模型C指数值

SGT (1) 和 SGT (2) 分别代表基于基因表达数据和微RNA表达数据的SGT方法;最右侧列汇总了CoFormerSurv模型及消融实验对应变体模型在所有癌症数据集上的平均C指数值。最优和次优结果分别以粗体和下划线标注。

特征分析

图3特征提取网络输出层各隐藏节点的特征表示与筛选出的基因标志物表达量间的皮尔逊相关系数

CoFormerSurv模型在不同多组学数据类型上的性能

图4 基于基因表达和/或DNA甲基化数据的各对比方法C指数值

随机生存森林(RSF)、深度生存分析模型(DeepSurv)、深度竞争风险生存模型(DeepHit)和图卷积聚合生存模型(AGGSurv)为基于基因表达或DNA甲基化数据的单组学方法;其余方法为同时利用DNA甲基化和基因表达数据的多组学方法。

图5基于DNA甲基化和/或微RNA表达数据的各类方法C指数值

随机生存森林(RSF)、深度生存分析模型(DeepSurv)、深度竞争风险生存模型(DeepHit)和图卷积聚合生存模型(AGGSurv)为基于DNA甲基化或微RNA表达数据的单组学方法;其余方法为同时利用DNA甲基化和微RNA表达数据的多组学方法。

表4 CoFormerSurv模型与现有方法在基因表达和/或DNA甲基化数据上的AUC值

表格上半部分为单组学方法在基因表达或DNA甲基化数据上得到的AUC值,下半部分为多组学方法的对应结果。最优和次优结果分别以粗体和下划线标注。

表5 CoFormerSurv模型与现有方法在DNA甲基化和/或微RNA表达数据上的AUC值

表格上半部分为单组学方法在DNA甲基化或微RNA表达数据上得到的AUC值,下半部分为多组学方法的对应结果。最优和次优结果分别以粗体和下划线标注。

详细总结

思维导图(mindmap)

将CoFormerSurv与单组学方法(RSF、DeepSurv、DeepHit、AGGSurv)和多组学方法(HFBSurv、SurvCNN、GCGCN、GANMOSurv、SATMOSurv、FGCNSurv)进行全面对比,核心性能指标

为验证CoFormerSurv各模块的有效性,研究构建了6种模型变体并开展消融实验,各模型平均C-index结果如下表所示,核心结论

参考

PLoS Comput Biol. 2026 Jan 7;22(1):e1013875. doi: 10.1371/journal.pcbi.1013875.

CoFormerSurv: Collaborative transformer for multi-omics survival analysis

260107CoFormerSurv.pdf

注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。

http://www.jsqmd.com/news/607392/

相关文章:

  • 智能垃圾桶的物联网升级实战:用ESP8266+STM32实现远程监控(MQTT协议详解)
  • Arduino Modbus主站库SensorModbusMaster实战指南
  • 怎样快速提升Windows性能:开源工具Win11Debloat的完整优化指南
  • ArcGIS新手避坑指南:处理三调数据DLTB时,关于‘请查询:DLBM’的那些事儿
  • 边缘AI部署:TensorFlow Lite与ONNX Runtime的技术架构与应用挑战——面向软件测试从业者的深度解析
  • 第17章 增长推广:让更多人知道你
  • 如何免费解锁SonarQube社区版的分支分析:完整安装指南
  • DeepSeek V4全面转向华为昇腾,国产算力生态迎来里程碑
  • OmenSuperHub:释放硬件潜能的游戏本性能管理革新
  • 嘉立创EDA专业版与Photoshop联袂:不规则面板设计全流程解析
  • 实战指南:将CrowdHuman数据集ODGT标注高效适配YOLO训练流程
  • 千万级数据表优化:分库分表、分区、索引最佳实践生产实战
  • 多模态开发工具:LangChain与LlamaIndex——赋能软件测试的新引擎
  • STPopup底部表单设计:如何创建类似iOS原生控件的用户体验
  • 网易云音乐推荐算法如何精准调校?这款免费工具帮你快速重塑音乐品味
  • 抖音直播回放智能下载工具:从技术实现到价值创造的完整指南
  • Cuvil编译器安全边界实测报告(CVE-2024-38291绕过防护+Tensor级IR验证缺失预警)
  • 别再只抄代码了!ESP32蓝牙网关项目实战,这些配置细节和调试技巧才是关键
  • 抖音视频批量下载实战:3分钟搞定无水印收藏,高效管理你的数字内容
  • 第19章 AI创业趋势:看见未来
  • 硬件器件考核题库【器件选型+应力考核+答案解析】-3(熔断器)
  • Envato Elements学生优惠全攻略:如何用教育折扣每天4元无限下载百万素材
  • Blue-Topaz主题高效配置指南:5分钟打造个性化Obsidian笔记环境
  • 紫光Pango开发环境避坑指南:从License申请到Synplify版本回退的完整踩坑记录
  • 第18章 规模化与团队建设:从个人到组织
  • BetterGenshinImpact:智能自动化游戏辅助工具的技术实践与应用指南
  • R3nzSkin开源工具:重新定义英雄联盟视野控制的技术实践
  • 火灾检测数据集全解析:从经典到前沿
  • 终极指南:OpenVINO AI Audacity插件让你的音频编辑智能化
  • Nginx配置代码化自动部署-Jenkins/Github方案