当前位置: 首页 > news >正文

NPJ Precis Oncol(IF=8)哈尔滨医科大学附属肿瘤医院韩鹏等团队:一种可解释的深度学习生物标志物用于胃癌预后评估及辅助化疗获益预测

01

文献学习

今天分享的文献是由哈尔滨医科大学附属肿瘤医院韩鹏教授等团队于2026年5月7日在肿瘤学领域顶刊《npj Precision Oncology》(中科院1区top,IF=8)上发表的研究“An interpretable deep learning biomarker for prognostication and prediction of adjuvant chemotherapy benefit in gastric cancer”即一种可解释的深度学习生物标志物用于胃癌预后评估及辅助化疗获益预测,本研究开发了一种基于Transformer的弱监督深度学习模型,从常规H&E染色的全切片图像(WSIs)中提取病理风险评分(TPRS),用于胃癌患者的总生存期(OS)预测和辅助化疗获益识别。TPRS在内部(HMU-GC,n=2,876)和外部(TCGA-STAD,n=355)数据集中均表现出良好的预后分层能力,并通过中介分析构建了“基因 → 细胞特征 → TPRS”的生物解释链,增强了模型的可解释性。

创新点:①无需人工标注的端到端框架,基于Transformer的弱监督学习,自动生成病理风险评分,避免手动标注肿瘤区域。②构建“基因→细胞特征→TPRS”解释链,通过中介分析揭示基因如何通过细胞形态影响预后,打破深度学习“黑箱”。③预后与化疗获益双重预测能力,模型不仅预测生存,还能识别辅助化疗受益人群,拓展了风险评分的应用边界。

临床价值:①补充TNM分期不足,提供独立预后信息,改善同分期患者的风险分层与个体化治疗决策。②指导II-III期患者化疗选择,有效筛选能从辅助化疗中获益的亚组,避免不必要的治疗与副作用。③基于常规病理切片,可及性高,无需额外分子检测,成本低、易推广,适合资源有限地区使用。

图 1:研究整体工作流程图

a:病理图像预处理流程

组织切片→数字化扫描为全切片图像(WSI)→组织自动分割→图像分块(patch)→分辨率标准化(40×降采样为20×,统一为512×512像素)→半自动去除笔痕伪影→保留纯净组织块。

b:TPRS模型构建流程

①用UNI预训练模型提取patch的1024维特征;

②多患者批量填充(padding)处理不同患者patch数量差异;

③输入Transformer生存网络,融合年龄、性别临床协变量;

④联合损失函数(负对数似然损失NLL+排序损失rank loss)优化;

⑤MLP头输出TPRS风险评分

c:下游分析与可解释性框架

TPRS划分高低风险→生存分析→化疗获益筛选→细胞特征分析+中介分析→构建Gene→Cell Feature→TPRS生物学解释链。

02

研究背景和目的

研究背景

胃癌是全球范围内发病率与死亡率均位居前列的恶性肿瘤,尽管诊疗技术不断进步,但肿瘤异质性强、早期筛查不足等问题导致患者预后差异显著。目前临床最广泛使用的TNM分期系统虽为治疗分层提供了基础,却无法全面反映肿瘤的异质性,导致相同分期患者对治疗的反应和生存结局差异巨大。虽然高通量转录组分析可为精准医学提供关键信息,但其成本高昂、操作复杂、可能损伤样本等缺点限制了临床推广。相比之下,常规苏木素-伊红(H&E)染色的全切片图像(WSIs)不仅可揭示肿瘤微环境,还能捕获与分子特征相关的复杂细胞形态,如肿瘤细胞特征、免疫细胞浸润模式等,这些信息对预后预测和治疗指导具有重要价值。然而,人工提取细胞特征主观且耗时,而现有深度学习模型在临床转化中面临三大核心挑战:一是多数流程需要人工标注肿瘤区域,自动化程度低;二是研究重心多局限于预后预测,忽视了模型对化疗方案选择的预测潜力;三是深度学习模型的“黑箱”属性导致其预测结果缺乏生物学可解释性,难以获得临床信任。因此,亟需开发一种全自动、端到端、可解释的深度学习方法,直接从WSIs中提取预后和预测信息,为胃癌精准治疗提供可靠依据。

研究目的

本研究旨在开发并验证一种基于Transformer的可解释深度学习框架,通过弱监督学习从常规H&E染色的WSIs中生成病理风险评分(TPRS),用于胃癌患者的总体生存分层辅助化疗获益预测。具体目标包括:第一,构建一个无需任何人工标注的完全端到端模型,能够自动处理WSIs并直接输出TPRS评分;第二,在大规模内部数据集(HMU-GC,n=2,876)独立外部TCGA-STAD数据集(n=355)中系统验证TPRS的预后价值,并通过十折交叉验证、多变量Cox回归等统计学方法确认其独立于TNM分期的预后因子地位;第三,探索TPRS作为预测性生物标志物的应用潜力,评估其能否有效识别可从辅助化疗中获益的II-III期胃癌患者,并分析不同化疗方案(如SOX、XELOX、氟尿嘧啶类)的特异性疗效;第四,破解深度学习模型的“黑箱”问题,通过注意力热图可视化、细胞核特征提取和转录组差异表达分析,构建从关键基因→细胞形态特征→TPRS评分的多层级中介解释链,阐明TPRS背后的生物学机制,使其预测结果具有可解释的病理和分子基础,从而增强临床医生的信任度并推动实际应用转化。

03

数据和方法

研究数据

内部队列(HMU-GC):哈尔滨医科大学肿瘤医院2014-2022年收治的2876例胃癌手术患者,2986张H&E-WSI,10%(288例)为内部测试集。

外部验证队列(TCGA-STAD):癌症基因组图谱数据库355例胃癌患者,380张合格H&E-WSI。

转录组数据:HMU-GC队列266例、TCGA-STAD队列331例患者的肿瘤表达数据。

技术方法

1. 图像预处理

自动组织分割 + 半自动去除笔痕伪影

分辨率标准化:统一为20×,patch大小512×512像素

2. 特征提取

使用UNI基础模型提取每张patch的1024维特征向量

3. 模型架构

Transformer+多患者批次训练(带padding和mask)

融合年龄和性别信息

联合损失函数:负对数似然(NLL)+ 排序损失(ranking loss)

4. 统计与验证

C-index、时间依赖性AUC、Brier评分、校准曲线、决策曲线分析(DCA)

多变量Cox回归、KM生存曲线、log-rank检验

缺失数据处理:多重插补(multiple imputation)

模型解释:t-SNE、注意力热图、TIAToolbox细胞特征提取、CIBERSORT免疫浸润、中介分析

04

实验结果

预后性能

内部C-index:0.769(95% CI: 0.712–0.818)

外部C-index:0.627(95% CI: 0.587–0.659)

5年AUC:内部0.776,外部0.773

多变量Cox调整后HR:内部2.18,外部2.36(均p<0.01)

分层能力

65百分位为最佳阈值,显著区分高/低风险组

亚组分析(年龄、性别、TNM分期、Lauren分型等)均稳健

化疗获益

高TPRS的III期患者显著获益于辅助化疗(HR 0.74–0.57)

具体方案:SOX、XELOX、氟尿嘧啶类均有效

生物学解释

高TPRS区域:肿瘤细胞比例高

低TPRS区域:炎症细胞比例高

中介分析识别出关键基因(如OR7A17、PANX3、MTRNR2L11)通过细胞特征(比例、计数、交互)影响TPRS

免疫分析:中性粒细胞↓、M0巨噬细胞↑、TNFSF4↑

图 2:TPRS性能评估

该图验证了TPRS的预测能力与稳健性。(a)C-index比较:三种训练策略中,结合临床信息(年龄、性别)且批次为8的策略表现最佳,内部C-index达0.765±0.003,外部TCGA-STAD为0.621±0.005(b)数据量鲁棒性:使用25%、50%、75%、100%训练数据时模型性能保持稳定,C-index波动极小。(c-d)阈值选择:基于最小对数秩P值确定第65百分位数为最佳分层阈值。(e-f)Kaplan-Meier曲线:在内部HMU-GC和外部TCGA-STAD数据集中,高TPRS组的总生存期显著劣于低TPRS组(均P<0.0001),证明TPRS能有效区分不同风险患者。

图 3:HMU-GC数据集中TPRS的森林图

该森林图展示了TPRS在不同亚组中对总生存期的风险比(HR)。无论患者年龄(≤60或>60岁)、性别、肿瘤大小、位置、T分期、N分期、M分期、TNM分期、组织学分级、Lauren分型、残留肿瘤状态、神经/血管侵犯、肿瘤标志物水平、HER2状态以及是否接受化疗,高TPRS组的HR均显著大于1(P<0.001)。其中,在TNM I-II期患者中HR最高(4.99),提示TPRS对早期患者的风险区分能力尤为突出。即使在化疗亚组中,高TPRS患者的死亡风险仍比低TPRS高2.97倍,表明TPRS是独立于治疗效果的强预后因子。

图 4:TPRS与Lauren分型的预后比较

该图比较了TPRS与经典Lauren分型的风险分层能力。在HMU-GC数据集中,高TPRS患者的预后显著差于弥漫型患者(P<0.0001),低TPRS患者的生存显著优于肠型患者(P<0.0001);高TPRS组中肠型仅占36.9%,而低TPRS组中肠型占58.2%,表明TPRS提供了超越Lauren分型的额外信息。在TCGA-STAD数据集中,高TPRS与弥漫型、低TPRS与肠型之间无显著差异(P>0.05),这可能与外部数据集样本量较小或异质性有关。饼图显示了各TPRS组内Lauren分型的分布比例。

图 5:TPRS联合TNM分期预测化疗获益

该图分析了Ⅱ-Ⅲ期胃癌患者中TPRS对辅助化疗获益的预测价值。(a-d)KM曲线:在HMU-GC和TCGA-STAD中,TPRS均能进一步将相同TNM分期的患者区分为高/低风险组(P<0.05)。(e)HMU-GC森林图:Ⅲ期高TPRS患者接受化疗后生存显著获益(HR=0.74,95%CI 0.61-0.90);Ⅱ期患者无论TPRS高低均未见显著化疗获益。(f)TCGA-STAD森林图:Ⅱ/Ⅲ期高TPRS患者化疗均有显著获益(HR=0.57),低TPRS患者同样显示获益(HR=0.08)。这表明TPRS可作为预测辅助化疗疗效的生物标志物,尤其有助于识别Ⅲ期高风险人群中的潜在获益者。

=

图 6:TPRS的可视化与生物学解释

该图揭示了TPRS背后的细胞和分子基础。(a)高/低TPRS图像块:直观对比显示高风险区域细胞形态差异。(b)t-SNE降维:高TPRS与低TPRS的图像块特征在空间中明显分离。(c)注意力热图:红色区域(高关注)对应肿瘤细胞密集区,蓝色区域(低关注)对应间质或炎症区。(d)细胞类型比例:高TPRS组中肿瘤性上皮细胞比例显著更高(P<0.0001),而低TPRS组中炎症细胞比例更高(P<0.0001)。(e)中介分析:构建了从基因(如OR7A17、PANX3、MTRNR2L11)经细胞特征(细胞比例、核形态、细胞间相互作用)到TPRS的因果解释链,橙色和蓝色箭头分别表示正/负中介效应。

05

研究结论

该研究开发并验证了一个基于弱监督Transformer模型的病理风险评分(TPRS),用于胃癌患者的预后分层和辅助化疗获益预测。TPRS在内部大样本队列(HMU-GC,n=2,876)和外部独立队列(TCGA-STAD,n=355)中均表现出良好的预测性能(内部C-index=0.769,外部C-index=0.627),并作为独立预后因子显著区分高低风险人群。关键发现是:在III期胃癌患者中,高风险TPRS群体接受辅助化疗可显著延长总生存期,提示TPRS具有指导化疗决策的潜力。通过中介分析和细胞特征提取,研究进一步构建了“基因→细胞特征→TPRS”的可解释链条,识别出如OR7A17、PANX3等关键基因通过影响肿瘤细胞比例、核形态和细胞间相互作用等细胞特征来驱动预后风险。此外,TPRS与免疫微环境特征(如中性粒细胞减少、M0巨噬细胞增加)显著相关,增强了其生物学合理性。总体而言,TPRS作为一个无需人工标注、可解释性强的深度学习病理标志物,有望在临床上辅助胃癌患者的精准预后评估与个体化治疗决策。


参考文献:Ji J, Zhang X, Hua M, Wang M, Li H, Zheng X, et al. An interpretable deep learning biomarker for prognostication and prediction of adjuvant chemotherapy benefit in gastric cancer. NPJ Precis Oncol. 2026. doi: 10.1038/s41698-026-01449-3.

http://www.jsqmd.com/news/780435/

相关文章:

  • 基于Base网络与x402协议的微支付系统pinion-os开发实战
  • Vue 中对象键名重复导致数据被覆盖的原理与解决方案
  • 华恒智信助力国有交通行业构建“平稳·节能·服务·应急”四维任职资格体系
  • redis 8.6.3 最新版重磅发布:安全修复、核心 Bug 修复与模块优化全面升级
  • 抖音视频批量下载工具:免费无水印保存创作者所有作品
  • 【计算机网络】第23篇:Wireshark抓包分析的方法论——过滤表达式、跟踪流与统计工具
  • 抖音批量下载神器:零代码轻松保存无水印视频、图集和直播回放
  • 浏览器本地AI助手实现:基于WebAssembly与WebGPU的模型部署与优化
  • navicat 17 lite 安装教程
  • 期货反向跟单:别让焦虑把你逼疯!
  • Godot MCP Pro:AI驱动的游戏开发副驾驶,172个工具重塑工作流
  • PHP工作流优化,让你的代码飞起来!
  • AI代码巫师:基于OpenClaw的智能编程技能设计与实战
  • Agent-Harness:AI智能体评估框架,构建标准化测试与性能基准
  • 【计算机网络】第25篇:Linux网络数据包的解剖路径——从网卡驱动到协议栈的关键路径
  • openKylin项目新增捐赠人
  • 基于RAG的本地化智能笔记助手:用obsidian-Smart2Brain构建你的第二大脑
  • 筑牢国家安全防线,赋能企业合规发展
  • ARM SIMD向量比较指令VCGT/VCLT详解与应用
  • 便携式智能设备硬件设计:RISC处理器与低功耗优化
  • 别再手动算周期了!用Excel快速搞定STC8H8K64U硬件PWM频率与占空比参数表
  • 用二级指针实现字符串数组
  • 2026年口碑好的天津文旅美陈装置定制综合评价公司 - 行业平台推荐
  • 基于Electron构建多AI工具桌面应用:WebView池化与状态管理实战
  • 机器人技能实验复现指南:从开源机械爪到可复现研究
  • NEMA与IEC电机标准解析及工业应用实践
  • 从零构建私有知识库:基于向量检索与RAG的AI知识引擎实践
  • 酒店住宿业数字化解决方案:从预订到客房的全链路技术实践
  • GitHub知识聚合库:如何高效利用开源项目构建个人技术学习体系
  • 寻找优质光伏电机供应商?这五个关键点帮你避坑