如何将CT影像组学与深度学习特征与肝细胞癌的缺氧-免疫抑制-代谢重编程恶性微环境关联,进一步解释与TACE预后及肿瘤生物学行为的机制联系
01
导语
各位同学,大家好。现在做影像组学,如果还只停留在“提取特征—建个模型—算个AUC”,那就有点像算命算得挺准,但为啥准,自己也说不明白。别人一问:你这特征到底代表啥?背后有啥道理?瞬间就成了黑箱本箱。而真正能打高分、站得住脚的研究,都在干一件事——给影像组学找“生物学娘家”,让宏观图像和微观病理、细胞、基因、通路对上话。今天咱们就通过这篇Gut文献,看看人家是怎么把CT影像风险评分一路挂靠到缺氧‑免疫抑制‑代谢重编程这个恶性闭环上的。你会发现:模型关注的肿瘤‑正常界面(invasive front)正好是缺氧和免疫交互的核心区;高风险组里几乎所有细胞类型缺氧评分都飙高,CD8+T和NK细胞的细胞毒性却被打压;再加上MYC、EMT、糖酵解通路一通激活——整个故事就串起来了:影像模型不是“瞎猜”,而是读出了肿瘤微环境的“恶劣程度”。这就是从“只会算分的工具人”,升级成“能讲清疾病故事的研究者”的典型范例。
★题目:Hypoxia-related and immune phenotype-related fusion model for non-invasive prognostication of hepatocellular carcinoma treated by TACE: a multicentre study
(融合缺氧与免疫表型的无创模型对经TACE治疗肝细胞癌患者的预后评估价值)
★期刊:《Gut》(中科院1区,IF=26.2)
★研究疾病:肝细胞癌(HCC)
★生物学机制:肿瘤缺氧通路激活、免疫抑制微环境、代谢重编程
★发表时间:2026年3月1日
02
研究背景-从 “临床问题” 落到 “生物学问题”
肝细胞癌(HCC)是全球最常见的原发性肝癌,多数患者确诊时已处于中晚期,失去根治性手术机会。经动脉化疗栓塞(TACE)是中晚期HCC 的标准治疗手段,但临床实践中发现,接受 TACE 治疗的患者生存结局存在巨大异质性:部分患者可获得长期缓解,而另一些患者却迅速进展。现有临床预后评分系统(如 CLIP、Up-to-7、Six-and-twelve、SNACOR 等)主要依赖肿瘤数目、大小、甲胎蛋白、肝功能等常规指标,无法充分捕捉肿瘤内在的生物学差异,导致对 TACE 疗效的预测能力有限。近年来,深度学习与影像组学可以从常规 CT图像中自动提取人眼无法识别的高维特征,为无创预后建模提供了新途径。然而,已有研究多为单模态、二维分析,且普遍存在“黑箱”问题——模型能预测,却说不清“为什么”。缺乏生物学解释使得临床医生难以真正信任和使用这些模型。因此,一个亟待解决的科学问题是:影像模型所定义的高风险人群,其肿瘤内部究竟发生了哪些分子与细胞层面的改变?具体而言,是否存在着免疫抑制微环境、缺氧状态、代谢重编程或关键致癌通路的异常激活?只有将影像表型与底层生物学机制挂靠起来,才能让影像模型从“统计关联”走向“临床可信”。本研究正是基于这一背景,从临床预后异质性问题出发,逐步深入到肿瘤免疫微环境和缺氧代谢等生物学问题,试图建立一个既精准又可解释的 TACE 预后评估体系。
03
研究目的(明确写出“三层目的”)
本研究设计了清晰的三层目的,层层递进。第一层(临床目的):利用大规模多中心 HCC 患者数据,构建一个能够无创、精准预测 TACE 治疗患者总体生存(OS)和无进展生存(PFS)的多模态预后模型,要求其预测性能优于现有临床评分系统,并能在多个独立外部队列中稳定验证。第二层(技术目的):系统比较 2D、2.5D、3D 深度学习模型与传统影像组学模型的预后效能,探索早期融合(特征级)与晚期融合(决策级)两种策略的优劣,并进一步将最优影像模型与关键临床变量整合,形成临床‑影像模型(CRM),以实现风险分层的最大效能和临床实用性。第三层(机制目的,即挂靠生物学的核心):利用公开的多组学数据(TCGA‑LIHC)和自测的单细胞转录组(scRNA‑seq)数据,深入解析影像模型所定义的高风险组与低风险组之间在肿瘤免疫微环境、细胞功能状态、关键信号通路(如 MYC、EMT、糖酵解、缺氧、干扰素应答等)上的系统性差异。通过这一机制层面的分析,回答“为什么影像模型能预测预后”——即高风险组是否对应着一种“免疫抑制‑代谢重编程‑微环境缺氧”的恶性生物学状态,从而为影像模型提供坚实的生物学解释,增强其临床转化价值。
04
研究思路(最核心:怎么挂靠机制)
本研究的核心思路是“从影像表型到生物学机制”的跨尺度桥接,具体分为三个串联步骤。第一步:构建影像风险评分作为“数字活检”标签。研究者首先利用 1349 例 HCC 患者的治疗前增强 CT 图像,训练 2D、2.5D、3D 深度学习模型和传统影像组学模型,经比较发现晚期融合模型(LFM)表现最佳(C‑index 0.757)。进一步纳入临床变量后形成临床‑影像模型(CRM),其预测性能进一步提升(C‑index 0.767),并能在多个独立中心和不同治疗背景下稳健分层患者生存。该模型的风险评分成为后续所有机制分析的核心分组依据。第二步:将风险分组映射到独立的多组学与单细胞数据。研究者将高风险/低风险标签应用到 TCGA‑LIHC 队列(50 例,匹配转录组、突变、免疫浸润数据)和自测 scRNA‑seq 队列(8 例,11 种细胞类型)中,从而将影像定义的“表型差异”转化为可比较的“生物学分组”。第三步:多尺度机制验证——这是挂靠机制最核心的一步。在组织病理层面,比较两组炎症细胞与基质细胞密度;在转录组层面,通过 GSEA 分析 hallmark 通路(MYC、EMT、糖酵解、IFN 应答、缺氧等),并用 CIBERSORT 评估免疫细胞丰度;在单细胞层面,为每种细胞类型计算缺氧评分、凝血评分和细胞毒性评分,直接比较高/低风险组在相同细胞类型中的功能状态差异。通过这一从宏观影像到微观单细胞的完整证据链,研究最终揭示了高风险组普遍存在缺氧通路激活、凝血评分升高、CD8+ T 和 NK 细胞毒性下降、巨噬细胞向 M2 极化等恶性特征,从而成功将影像模型与肿瘤生物学机制挂靠起来。
05
数据和方法(机制部分怎么设计)
数据:本研究共纳入1448例 HCC 患者,包括:①TACE回顾性队列(n=1349),来自 8 个中心,分为训练集(n=753)、测试1集(n=366)和测试2集(n=230,WAW 外部验证),用于模型构建与独立验证;②随机对照试验子集(n=41),仅 TACE 单药组,用于biomarker外部验证;③scRNA‑seq队列(n=8),用于单细胞层面机制解析;④TCGA‑LIHC多组学队列(n=50),匹配转录组、突变及免疫数据,用于多组学机制验证。
方法:预处理(动脉期 CT → 归一化至腹部软组织窗 → 重采样至 1×1×1 mm³)→肿瘤自动分割(nnU‑Net + 人工校正,肿瘤+5mm 瘤周区域为输入)→特征提取(2D/2.5D/3D 深度学习 + 107 个影像组学特征)→单模态模型训练(2D: DenseNet161,2.5D: ResNet101,3D: ResNet10,影像组学: RSF,按测试1集 C‑index 选最优)→融合策略比较(早期融合: 特征拼接 + 生存学习器;晚期融合: stacking 集成→ 选LFM,C‑index=0.757)→整合临床变量(LFM + 临床/实验室指标 →CRM,C‑index=0.767)→生存评估(Kaplan‑Meier、C‑index、多因素 Cox)→机制分析(TCGA:差异表达、GSEA、CIBERSORT 免疫浸润;scRNA‑seq:UMAP分 11 类细胞,计算缺氧/凝血/细胞毒性模块评分,比较高/低风险组)。
图 1:研究整体工作流程图
06
研究结果(“从表型到机制”)
第一步:表型结果(影像模型有效)
CRM 在测试集 C‑index 达0.767,显著优于 CLIP、Six‑and‑twelve 等现有临床模型。Grad‑CAM 热图显示模型重点关注肿瘤‑正常肝脏界面(invasive front),该区域正是免疫交互与缺氧的核心区,为后续机制分析提供了空间线索。
图 2(单模态模型性能与Grad‑CAM定位):图2A–E展示了2D、2.5D、3D深度学习及影像组学模型的C-index,其中2.5D ResNet101表现最优(0.727)。核心挂靠证据来自图2C的Grad‑CAM热图:模型重点关注肿瘤‑正常肝脏交界区(invasive front),该区域已知是缺氧、免疫抑制和肿瘤侵袭的关键部位。这说明影像模型并非随机捕捉纹理,而是无监督地定位到了具有明确生物学意义的空间界面,为后续机制分析提供了可解释的解剖学锚点。
图 3(晚期融合模型LFM的性能与验证):图3A–C显示晚期融合(stacking)优于早期融合,LFM的C-index达0.757。图3D表明LFM评分与治疗反应(CR/PR/SD/PD)显著相关,高风险组更多为PD。图3E–H展示LFM在不同中心(HMU、JPH、MDACC)均能显著分层OS。机制挂靠体现在图3I–J的森林图:LFM在多因素校正后仍是独立预后因子,提示其捕获的生物学信息无法被传统临床指标(如BCLC、AFP)替代,可能反映了独特的缺氧‑免疫表型。
图 4(临床‑影像模型CRM的构建与优势):图4A–B显示CRM(整合临床变量+LFM)C-index达0.767,优于单独LFM及所有现有临床模型(CLIP、Six‑and‑twelve等)。图4C示CRM评分与治疗反应强相关。图4G是挂靠机制的关键:在Six‑and‑twelve和SNACOR模型定义的同一风险亚组内,CRM仍能进一步分出高/低风险患者。这说明影像‑临床融合模型捕捉到了传统评分无法识别的生物学异质性——即同临床分期下,肿瘤内在的缺氧‑EMT状态差异决定了不同预后。
第二步:机制结果(高风险 vs. 低风险)
①病理层面:低风险组肿瘤组织中炎症细胞和基质细胞密度显著更高,提示免疫微环境更活跃;高风险组则相反,呈现相对“冷”的病理特征。
②转录组/多组学:低风险组IFN‑γ/α通路激活、M1 巨噬细胞增多、M2 减少;高风险组MYC靶基因、EMT、糖酵解和缺氧通路显著富集,且 wound healing 评分升高。
图 5(多组学分析揭示LFM的生物学基础):该图是机制挂靠的核心证据。图5A显示LFM在TCGA中对OS/PFS有分层趋势(虽未达统计学显著,可能与样本量小有关)。图5C示低风险组M1巨噬细胞增多、M2减少,CD8+ T细胞有上升趋势。图5D的GSEA显示高风险组MYC靶基因、EMT、糖酵解通路显著激活,而低风险组IFN‑γ/α应答通路激活。图5E显示低风险组MSI评分更高。图5F–G展示两例影像、病理与多组学匹配的典型病例,直观呈现了影像风险评分与免疫‑缺氧表型的一致性。
③单细胞层面(最精彩的机制证据):高风险组中几乎所有细胞类型(肿瘤、CD8+ T、NK、巨噬细胞)的缺氧评分和凝血评分均显著升高,而 CD8+ T 与 NK 细胞的细胞毒性评分显著降低,巨噬细胞向 M2 极化。
图 6(单细胞RNA测序验证细胞层面机制):该图将机制证据推至单细胞分辨率。图6A–B展示11种细胞类型及组间差异表达基因。图6D–G的GSEA显示高风险组中几乎所有细胞类型(肿瘤、CD8+ T、NK、巨噬细胞等)均存在缺氧和凝血通路的广泛激活。图6H–J定量比较:高风险组在多数细胞中缺氧评分和凝血评分显著升高,而CD8+ T与NK细胞的细胞毒性评分显著降低。图6K–L展示两例影像与单细胞数据匹配的病例,从影像到单个细胞功能状态形成完整证据链,证实高风险对应“全细胞缺氧‑免疫抑制”恶性微环境。
第三步:整合结论(机制故事)
高风险患者处于“免疫抑制‑代谢重编程(缺氧/糖酵解)‑促凝”的恶性微环境中,导致 TACE 抵抗和不良预后。影像模型通过捕捉肿瘤‑基质界面的特征,间接读出了这一生物学状态。
07
讨论(把机制故事讲圆)
本研究提出的临床‑影像模型(CRM)之所以能够实现对 TACE 治疗 HCC 患者生存结局的精准预测,其根本原因在于影像特征并非“黑箱”信号,而是肿瘤内在生物学状态的外在投射。通过多组学和单细胞转录组数据的交叉验证,我们发现模型定义的高风险组对应着一种“免疫抑制‑代谢重编程‑微环境缺氧”的恶性闭环:缺氧通路的广泛激活不仅直接促进肿瘤细胞侵袭和 EMT,还通过上调糖酵解营造酸性微环境,抑制 CD8+ T 和 NK 细胞的细胞毒性功能,同时驱动巨噬细胞向 M2 型极化,形成免疫逃逸。这一机制故事的核心逻辑是“影像看到的其实是微环境状态”。特别值得注意的是,Grad‑CAM 热图显示模型重点关注肿瘤‑正常肝脏界面(invasive front),而近期空间转录组研究恰恰证实该区域是肿瘤细胞与基质细胞交互、缺氧梯度形成、免疫抑制建立的关键“入侵带”。因此,模型并非“神奇地预测预后”,而是在 CT 图像上捕捉到了这个生物学关键区域的空间异质性特征——例如肿瘤边界的毛刺程度、与周围组织的灰度对比、纹理紊乱等,这些宏观表型与微观的缺氧‑EMT‑免疫抑制状态具有内在关联。此外,本研究还排除了几个替代解释:高风险组与低风险组在临床分期、病理分级、肿瘤突变负荷及 PD‑L1 表达上无显著差异,说明模型的预测能力不是简单的“晚期肿瘤”或“高突变负荷”的代用品,而是反映了独特的缺氧‑代谢‑免疫表型。这一机制故事的完整性在于:从影像定位(invasive front)→ 细胞类型(全细胞缺氧)→ 通路(MYC/EMT/糖酵解)→ 功能(T/NK 细胞毒性下降)→ 临床结局(TACE抵抗),形成了闭环证据链,使得临床医生可以相信:CRM 高风险评分 ≈ 患者的肿瘤正处于一个“恶劣微环境”中,TACE 疗效有限,需考虑联合免疫或抗血管生成治疗。
08
这篇文献的可借鉴思路
这篇论文为影像组学/医学AI研究者提供了一套“从表型到机制”的标准研究范式,尤其适合那些希望提升模型生物学解释性、发表高水平论文的学者。第一,双队列设计思路:用一个大样本、多中心的回顾性影像队列训练模型并验证临床效能(这是“立身之本”),再独立设置一个小样本但深度解析的多组学/单细胞队列解释机制(这是“点睛之笔”)。这种设计成本可控(单细胞测序 8 例即可产生丰富信息),且能极大提升论文的深度和可信度。第二,风险评分作为“数字活检”标签的桥梁思路:不要试图将影像特征直接映射到单个基因或突变(容易过拟合且难以验证),而是先将患者划分为高风险/低风险两组,然后把这组标签“粘贴”到公共或自测的多组学数据上,比较两组的通路、免疫、代谢差异。这种做法将复杂的“影像‑基因”关联问题,转化为了成熟的“分组比较”问题,可操作性强。第三,善用公共数据库(TCGA、GEO)作为机制验证平台:TCGA‑LIHC 提供了免费的转录组、突变、免疫浸润数据,是验证任何影像模型生物学基础的“金标准”资源。第四,单细胞数据的“模块评分”技巧:即使没有自己的 scRNA‑seq,也可以从公共数据库下载或自行收集特定基因集(如缺氧相关基因、EMT 相关基因、细胞毒性基因),为每个细胞计算模块评分,然后比较高/低风险组在同一细胞类型中的差异。这种做法直接、直观、说服力强。第五,Grad‑CAM 定位关键区域:用热图展示模型关注的图像区域,并主动与已知的生物学关键区(如 invasive front、缺氧区、免疫交界区)建立联系,这是“挂靠机制”最简单有效的方法之一。第六,多模态晚期融合策略:2D+2.5D+3D 深度学习 + 传统影像组学 + 临床变量,通过stacking 集成,通常优于单一模型,且工程实现相对简单。第七,讨论中的“克制与诚实”:该文明确承认“相关非因果”,且没有强行将模型与免疫治疗疗效挂钩,这种科学的严谨性反而增强了可信度。总之,未来你如果要做影像组学 + 机制研究,完全可以照搬“大影像队列训练评分 → 风险分组 → 公共多组学验证 → 单细胞模块打分 → Grad‑CAM 定位”这一流程,既保证临床价值,又讲好生物学故事。
09
结语
总而言之,做影像组学不只是拼AUC、堆模型,更要学会给特征找意义、给模型讲道理。这篇文献给我们打了一个样:大影像队列训练评分 → 风险分组 → 公共多组学验证 → 单细胞模块打分 → Grad‑CAM定位关键区域,每一步都紧扣生物学。只有把宏观影像和微观机制真正打通,我们的研究才不是“玄学算命”,而是有根有据、有血有肉、能讲好疾病故事的真科研。希望大家以后都能少走弯路,轻松写出有机制、有深度、能发高分的好文章!
参考文献:Guo Y, Zhang G, Fu X, Jiang S, Li Y, Li S, Guo X, Zhang X, Zhao C, Ding R, Yu L, Yang X, Zhao K, Sun Y, Liu Q, Zhang Y, Duan X, Zhao H, Zou J, Liang B, Yang L, Zheng C, Kan X. Hypoxia-related and immune phenotype-related fusion model for non-invasive prognostication of hepatocellular carcinoma treated by TACE: a multicentre study. Gut. 2026 Mar 30:gutjnl-2025-337938. doi: 10.1136/gutjnl-2025-337938.
