如何将影像组学特征与侵袭性肝细胞癌亚型(MTM-VETC)建立关联,并进一步解释其与预后、免疫微环境重塑及靶向治疗响应的机制联系
01
导语
各位同学,大家好。现在做影像组学,如果还只停留在“提取特征—建个模型—算个AUC”,那就有点像算命算得挺准,但为啥准,自己也说不明白。别人一问:你这特征到底代表啥?背后有啥道理?瞬间就成了黑箱本箱。而真正能打高分、站得住脚的研究,都在干一件事——给影像组学找“生物学娘家”,让宏观图像和微观病理、细胞、基因、通路对上话。今天咱们就通过一篇最新文献,看看人家是怎么从MRI图像出发,不仅精准预测了肝细胞癌里最“凶”的那个亚型(MTM-VETC),还一路追下去,挖出了它背后的免疫抑制、代谢紊乱、关键基因,甚至找到了潜在靶向药。用轻松又实在的方式,聊聊影像组学怎么优雅、合理、不硬凑地挂靠生物学机制,从“只会算分的工具人”,升级成“能讲清疾病故事的研究者”。
★题目:Integrated analysis of radiomics and RNA reveals the biological basis and therapeutic implications of aggressive hepatocellular carcinoma subtypes
(影像组学与RNA的整合分析揭示侵袭性肝细胞癌亚型的生物学基础与治疗意义)
★期刊:《npj Precision Oncology》(中科院1区,IF=8)
★研究疾病:肝细胞癌(HCC)中的一种侵袭性病理亚型
★生物学机制:免疫抑制性肿瘤微环境、细胞增殖通路过度激活、代谢重构、关键枢纽基因
★发表时间:2026年1月
02
研究背景-从 “临床问题” 落到 “生物学问题”
肝细胞癌(HCC)是全球范围内最常见的原发性肝癌,具有高复发率和高死亡率。在HCC的病理亚型中,大梁-巨块型(MTM)与血管包裹肿瘤簇(VETC)是两种近年来被证实与高度侵袭性、预后极差密切相关的病理特征。MTM-HCC约占所有HCC的10%–15%,其组织学分级更高、分期更晚;而VETC模式则代表一种不依赖上皮-间质转化的新型转移机制,常导致患者术后复发率升高、总生存期缩短。值得注意的是,MTM与VETC在病理上高度重叠,二者共存的HCC亚型(MTM-VETC HCC)具有最强的侵袭性和最差的预后。然而,目前该亚型的诊断仍依赖于术后病理活检,缺乏术前精准识别手段,极大限制了其临床分层管理与个体化治疗的实施。近年来,影像组学结合转录组学(radiogenomics)的研究范式逐渐兴起,能够将影像表型与肿瘤的分子特征、免疫微环境、代谢状态等生物学行为关联起来。已有研究尝试基于CT或MRI构建MTM或VETC的预测模型,但其生物学机制解析仍不充分,尤其是对于MTM-VETC这一双重阳性亚型,其肿瘤微环境特征、关键驱动基因、潜在治疗靶点尚缺乏系统性探索。因此,如何通过影像组学无创识别该亚型,并揭示其背后的生物学机制,成为当前HCC精准诊疗中的重要科学问题。
03
研究目的(明确写出“三层目的”)
本研究旨在构建一种基于MRI的影像组学预测模型,实现对MTM-VETC这一侵袭性HCC亚型的术前精准识别,并进一步通过影像-转录组关联分析揭示其生物学基础与治疗策略,整体目标可归纳为三个层次:第一,模型构建与验证层,即利用多中心HCC患者的临床资料与对比增强MRI影像,构建临床-影像组学联合模型,并在外部验证集中评估其对MTM-VETC亚型的预测性能,同时检验其在患者无进展生存期(PFS)分层中的预后价值;第二,生物学机制揭示层,即通过对高风险组与低风险组的转录组数据进行差异表达分析、功能富集分析(GO/GSEA)以及免疫细胞浸润分析(CIBERSORTx、ssGSEA),揭示高风险组在免疫抑制、细胞增殖、代谢重构等方面的分子特征,建立影像表型与肿瘤生物学行为之间的内在联系;第三,临床转化探索层,即通过加权基因共表达网络分析(WGCNA)识别与风险评分最相关的基因模块,进一步筛选出关键枢纽基因(如ADAM9、PTK2B),结合CMap药物预测分析识别潜在治疗药物(如KIT抑制剂),并构建基于枢纽基因的预后模型,在TCGA和GEO数据库中验证其预后价值,从而为MTM-VETC HCC患者提供个体化治疗靶点与治疗策略。
04
研究思路(最核心:怎么挂靠机制)
本研究的核心思路是以影像组学风险评分为桥梁,挂靠转录组学揭示生物学机制,实现从“影像表型”到“分子机制”再到“治疗策略”的闭环研究。具体路径如下:首先,研究团队基于多中心HCC患者的临床资料与MRI影像,提取影像组学特征,结合血清AFP水平,采用XGBoost与逻辑回归构建临床-影像组学模型,用于预测MTM-VETC亚型,并在外部验证集中评估其预测性能与预后分层能力。随后,研究将临床-影像组学模型评分作为影像表型标签,将患者划分为高风险组与低风险组,并关联其转录组数据,通过差异表达基因(DEGs)分析、GO功能富集与GSEA通路分析,揭示高风险组在免疫相关通路、细胞周期、代谢通路等方面的富集特征。在此基础上,研究进一步采用CIBERSORTx与ssGSEA量化肿瘤微环境中免疫细胞浸润比例,明确高风险组的免疫抑制特征,如M2巨噬细胞增多、NK-T细胞减少等。为锁定与风险评分最相关的分子模块,研究采用WGCNA构建共表达网络,识别出与风险评分显著相关的“light yellow”模块,并通过PPI网络与CytoHubba筛选枢纽基因,最终锁定ADAM9与PTK2B作为关键预后基因。随后,研究通过CMap分析预测针对枢纽基因的潜在治疗药物,发现KIT抑制剂(如索拉非尼)在逆转高风险组基因表达谱中具有较高潜力。最后,研究基于枢纽基因构建A-P评分预后模型,并在TCGA与GEO数据库中验证其对HCC患者预后的分层能力,从而完成从影像模型、机制解析到靶点识别、预后验证的全链条研究设计。
05
数据和方法(机制部分怎么设计)
数据:本研究共纳入来自三家机构的266例肝细胞癌患者用于影像组学模型构建,其中训练集162例(来自顺德医院)、外部验证集1共74例(来自佛山医院)、外部验证集2共30例(来自TCGA数据库);另选取其中110例具有完整随访资料的患者作为结局集用于预后分析;基因组集包含29例TCGA-HCC患者的转录组数据用于影像-转录组关联分析,GSE14520队列(242例)作为外部验证集用于验证枢纽基因的预后价值。
图 2:患者筛选流程图
方法:影像组学模型构建:MRI图像经N4偏置校正、重采样与灰度离散化后,提取636个影像组学特征,经reproducibility筛选(ICC > 0.75)→ 单变量逻辑回归(p < 0.05)→ Pearson相关性分析(r > 0.75剔除冗余)→ LASSO回归降维,最终将筛选出的特征纳入XGBoost构建影像组学模型,并通过scale_pos_weight参数处理样本不平衡问题;临床-影像组学模型在此基础上联合血清AFP与影像组学评分通过多变量逻辑回归构建。生物学机制分析:基于临床-影像组学模型评分将患者分为高/低风险组→ edgeR筛选差异表达基因(|log2FC| > 1,FDR < 0.05)→ GO与GSEA进行功能富集分析 → CIBERSORTx与ssGSEA量化免疫细胞浸润比例 → Spearman相关分析风险评分与Ki-67表达关联。枢纽基因与药物预测:WGCNA(软阈值为10)识别与风险评分最相关的基因模块 → STRING构建PPI网络 → CytoHubba的12种拓扑算法取交集筛选枢纽基因 → CMap分析(FDR < 0.05,归一化连接分 < 0且排名前1%)预测潜在治疗药物 → Cox回归与Kaplan-Meier分析枢纽基因预后价值并在GSE14520中验证。
图 1:研究整体工作流程图
06
研究结果(”从表型到机制“)
模型预测性能:临床-影像组学模型在训练集、外部验证集1和验证集2中的AUC分别达到0.92、0.84和0.79,显著优于LI-RADS基线模型(AUC 0.51–0.61)。决策曲线与校准曲线显示该模型具有良好的临床净收益与校准度,高风险组患者无进展生存期显著更差(p < 0.05)。
图 3(模型构建与性能评估):该图展示了临床-影像组学模型的构建过程与预测性能。图3a的森林图显示血清AFP(OR=4.27)与影像组学评分(OR=1.06)是MTM-VETC亚型的独立预测因子;图3b的列线图将二者整合为可视化预测工具;图3c-3e的ROC曲线显示临床-影像组学模型在训练集(AUC=0.92)、验证集1(AUC=0.84)和验证集2(AUC=0.79)中均显著优于LI-RADS基线模型。该图体现了影像组学评分作为影像表型定量指标,能够有效预测侵袭性亚型。
图 4(模型综合性能评估与预后分层):该图从多个维度评估模型的临床实用性与预后价值。图4a-4c的雷达图显示临床-影像组学模型在AUC、灵敏度、特异度、F1分数等指标上综合性能最优;图4d-4f的决策曲线表明该模型在15%-60%阈值概率范围内具有最高的临床净收益;图4g-4j的校准曲线显示其预测概率与实际结果高度一致;图4k-4l的Kaplan-Meier曲线证实高风险组患者无进展生存期显著更差(p<0.05)。该图将影像模型与预后结局直接关联,体现了影像表型的临床价值。
免疫抑制特征:高风险组中M2巨噬细胞浸润显著增加,NK-T细胞比例显著下降。GSEA显示炎症反应、干扰素α/γ应答通路激活,GO分析进一步证实差异基因富集于免疫相关通路,揭示高风险组呈现免疫抑制性肿瘤微环境。
增殖与代谢特征:高风险组中G2M检查点、E2F靶点、PI3K-AKT-mTOR信号通路显著激活,临床-影像组学评分与Ki-67增殖指数呈显著正相关(r = 0.31,p < 0.001)。同时,胆汁酸代谢、脂肪酸代谢等代谢通路在高风险组中被显著抑制。
图 5(影像-转录组关联机制分析):该图是影像组学挂靠生物学机制的核心图。图5a的GO分析显示差异基因主要富集于免疫相关通路;图5b-5d的GSEA揭示高风险组中细胞增殖通路激活(G2M检查点、E2F靶点、PI3K-AKT-mTOR)与代谢通路抑制(胆汁酸、脂肪酸代谢);图5e显示风险评分与Ki-67增殖指数呈显著正相关(r=0.31,p<0.001);图5f-5g的免疫浸润分析显示高风险组M2巨噬细胞增多、NK-T细胞减少。该图系统构建了“影像风险评分 → 免疫抑制微环境 + 增殖激活 + 代谢抑制”的机制链条。
枢纽基因与药物预测:WGCNA识别“light yellow”模块与风险评分相关性最强,通过PPI与12种拓扑算法筛选出ADAM9和PTK2B作为关键枢纽基因。CMap分析提示KIT抑制剂(如索拉非尼)为潜在治疗药物,其作用机制在候选化合物中频率最高。
预后模型验证:基于ADAM9与PTK2B构建的A-P评分预后模型在TCGA(n = 341)与GSE14520(n = 242)队列中均显示,低评分患者无进展生存期显著优于高评分患者(p < 0.01,log-rank检验),验证了枢纽基因的稳健预后价值。
图 6(枢纽基因识别与预后验证):该图将机制发现导向治疗靶点与预后模型。图6a的WGCNA显示“light yellow”模块与风险评分相关性最强,锁定与影像表型最相关的基因模块;图6b的CMap分析显示KIT抑制剂(如索拉非尼)在候选药物中频率最高,提示其为潜在治疗策略;图6c-6d的Kaplan-Meier曲线显示基于ADAM9与PTK2B构建的A-P评分在TCGA(n=341)与GSE14520(n=242)队列中均能显著区分患者预后(p<0.01)。该图实现了从影像风险评分 → 枢纽基因 → 药物预测 → 预后验证的完整转化路径。
07
讨论(把机制故事讲圆)
本研究通过影像组学与转录组学的整合分析,成功构建了能够术前预测MTM-VETC侵袭性HCC亚型的临床-影像组学模型,并系统揭示了该亚型的生物学基础与治疗策略。在模型层面,研究证实临床-影像组学模型在预测性能与预后分层能力上均显著优于传统LI-RADS模型,且血清AFP水平作为独立预测因子被纳入模型,与既往研究一致。在机制层面,本研究通过影像-转录组关联分析构建了一条从影像表型到分子机制的逻辑链条:高风险组呈现免疫抑制性微环境,表现为M2巨噬细胞浸润增加、NK-T细胞比例下降,这与胆汁酸代谢通路抑制密切相关。现有证据表明,胆汁酸代谢异常可促进M2巨噬细胞极化,进而抑制NK-T细胞聚集,激活IL6-JAK-STAT3信号通路,最终抑制肿瘤细胞凋亡并促进增殖。本研究的高风险组中IL6-JAK-STAT3通路的确呈显著激活状态,且Ki-67增殖指数与风险评分正相关,进一步印证了这一机制链条。在治疗策略层面,本研究通过WGCNA筛选出与高风险组最相关的基因模块,并经CMap分析发现KIT抑制剂是逆转高风险组基因表达谱的潜在药物,其中索拉非尼作为KIT抑制剂已被证实对VETC-HCC患者具有生存获益。进一步通过枢纽基因筛选与预后分析,本研究锁定ADAM9与PTK2B作为关键预后基因:ADAM9在多种肿瘤中过表达并与侵袭性相关,索拉非尼可抑制其表达从而增强NK细胞抗肿瘤活性;PTK2B则可增强STING-TBK1免疫应答通路。基于上述发现,本研究提出临床分层策略:临床-影像组学评分 > 0.15的患者定义为高风险组,建议采用手术联合免疫靶向治疗,如靶向M2巨噬细胞极化、NK-T细胞招募、KIT抑制剂或ADAM9/PTK2B靶向药物;低风险组(评分 < 0.15)则建议手术切除后常规影像随访。尽管本研究存在回顾性设计、样本量有限、算法标准化不足等局限,但其“影像表型-分子机制-治疗策略”的研究范式为HCC精准诊疗提供了重要参考。
08
这篇文献的可借鉴思路
本研究为影像组学如何挂靠生物学机制提供了可复制的范式,其核心思路可概括为“以影像风险评分为桥梁,串联转录组、功能通路、免疫微环境、枢纽基因与药物预测”。具体而言,研究者首先构建影像组学模型输出连续风险评分,将该评分作为“影像表型”标签对患者进行分组;随后通过差异表达分析与功能富集识别高风险组的关键通路(如免疫抑制、增殖激活、代谢抑制),并通过免疫浸润算法验证细胞层面的特征;在此基础上,利用WGCNA构建共表达网络,锁定与风险评分最相关的基因模块,避免单一基因的偶然性;再通过PPI网络与多种拓扑算法筛选枢纽基因,增强结果的稳健性;最后通过CMap分析预测潜在药物,并通过Cox回归与独立队列验证枢纽基因的预后价值。这一研究设计有五个关键亮点值得借鉴:第一,多中心影像数据与公共转录组数据的有机结合,既保证了模型泛化能力,又提供了机制解析的分子基础;第二,影像评分作为连续变量分组,而非依赖病理标签,使得机制分析更具临床相关性;第三,多维度机制验证(通路富集 + 免疫浸润 + Ki-67相关性)形成了三角互证,增强了结论的可信度;第四,WGCNA + PPI + CMap的串联分析将“基因发现”导向“靶点预测”,提升了研究的临床转化价值;第五,影像模型与基因预后模型的独立构建与互证,实现了从“无创诊断”到“预后分层”再到“靶向治疗”的全链条闭环。该思路可推广至其他癌种或疾病的研究中,尤其适用于探索影像特征背后的分子机制、筛选潜在治疗靶点、构建影像-基因联合预后模型等场景。
09
结语
总而言之,做影像组学不只是拼AUC、堆模型,更要学会给特征找意义、给模型讲道理。这篇文献给我们打了个样:从影像风险评分出发,一路串联起转录组差异、免疫浸润变化、代谢通路抑制、枢纽基因筛选、药物预测,最后还用独立队列做了预后验证。这种“影像表型—分子机制—治疗靶点”的闭环思路,才是影像组学研究的正确打开方式。只有把宏观影像和微观机制真正打通,我们的研究才不是“玄学算命”,而是有根有据、有血有肉、能讲好疾病故事的真科研。希望大家以后都能少走弯路,轻松写出有机制、有深度、能发高分的好文章!
参考文献:Chen Y, Cai Z, Luo C, Zhang R, Guo B, Chen H, Ouyang F, Chen X, Li X, Liu W, Zhou C, Guan X, Zeng X, Liu Z, Hu Q. Integrated analysis of radiomics and RNA reveals the biological basis and therapeutic implications of aggressive hepatocellular carcinoma subtypes. NPJ Precis Oncol. 2026 Jan 3;10(1):28. doi: 10.1038/s41698-025-01233-9.
