Radiol Artif Intell 中山大学肿瘤防治中心放疗科:基于连续MRI的深度学习模型预测局部晚期鼻咽癌患者生存期
01
文献信息
本次分享的文献是由中山大学肿瘤防治中心放疗科联合华南理工大学附属第六医院、南方医科大学和云南大学等机构在2025年2月发表在《Radiology: Artificial Intelligence》(中科院1区,IF=13.2)上的研究“A Serial MRI–based Deep Learning Model to Predict Survival in Patients with Locoregionally Advanced Nasopharyngeal Carcinoma”即基于连续MRI的深度学习模型预测局部晚期鼻咽癌患者生存期,该研究为多中心回顾性研究,纳入1039例局部晚期鼻咽癌(LA-NPC)患者,利用诱导化疗(IC)前后的系列MRI影像数据及临床因素,基于图卷积神经网络(GCN)构建影像组学-临床预后模型(model RC)。通过内部及外部队列验证,证实该模型预测无病生存期(DFS)的性能显著优于传统TNM分期,且能有效将患者分为低风险与高风险组。进一步分析显示,高风险组患者接受同步放化疗(CCRT)可显著获益,而低风险组获益不明显,为LA-NPC的风险适应性治疗提供了重要依据。
图 2:研究流程图
A部分 (ROI分割与特征提取选择): 展示了如何在治疗前、后的T1, T1C, T2序列上勾画肿瘤区域(GTV和转移淋巴结MLN),提取大量放射组学特征(497个),并通过mRMR和前向选择方法筛选出最优特征集(每个序列31个)。
B部分 (图构建): 展示了如何将每个患者的多个病灶(治疗前、后的原发灶和淋巴结)视为图结构中的“节点”(Vertex),并用特征(31个放射组学特征+病灶数量+3D坐标)来描述每个节点。节点之间的“边”(Edge)初始为全连接,捕捉病灶间的潜在关系。
C部分 (预后模型构建): 展示了如何将构建好的三个图(G_T1, G_T1C, G_T2)输入GCN模型,提取深层特征。随后使用深度多任务逻辑回归(Deep-MTLR)融合这些影像学深层特征和临床特征(如年龄、分期、EBV DNA),最终构建出放射组学-临床联合模型(Model RC)。
02
研究背景及目标
研究背景:
鼻咽癌(NPC)多见于南方中国,约70%患者初诊时为局部晚期(LA-NPC)。尽管诱导化疗(IC)+同步放化疗(CCRT)是标准方案,仍有20-30%患者治疗失败。现有分期及EBV DNA等预后工具大多在治疗前使用,缺乏治疗过程中动态预测工具。
研究目标:
构建并验证一个基于诱导化疗前后序列MRI结合临床指标的深度学习预后模型,用于预测局部晚期鼻咽癌患者的生存,并探索风险分层指导个体化治疗的可行性。
03
数据和方法
研究数据
患者来源与分组
纳入2011年12月至2016年1月确诊的1039例LA-NPC患者(男性779例,女性260例,平均年龄44±11岁),数据来自两个中心:
数据集A(中山大学肿瘤防治中心,826例):按8:2随机分为训练集(660例)和内部测试集(166例);
数据集B(梧州红十字会医院,213例):作为独立外部测试集。
纳入与排除标准
纳入标准:病理证实非转移性NPC、III-IVA期、接受2-4周期IC并完成调强放疗、IC前后4周内完成鼻咽部及颈部MRI、IC前后定量检测cfEBV DNA。
排除标准:既往头颈部放疗/手术、MRI覆盖不足(鞍上池至锁骨下缘)或序列不全(T1加权、T2加权、增强T1加权)、影像存在伪影。
随访数据
中位随访时间:训练集63.0个月,内部测试集60.5个月,外部测试集66.9个月;
结局事件:训练集23.9%、内部测试集24.1%、外部测试集17.8%的患者发生死亡、复发或转移。
图 1:患者选择流程图
技术方法
影像处理与特征提取
ROI分割:自动勾勒肿瘤大体体积(GTV)并人工校正,手动勾勒转移淋巴结,由2名资深放疗科医师共识完成,分歧由第三方专家裁定;
特征提取:通过标准化影像组学分析工具(SERA)从IC前后3种MRI序列(T1、增强T1、T2)中提取497个影像组学特征;
特征筛选:采用最小冗余最大相关性(mRMR)和前向特征选择法,最终保留各序列前31个特征。
模型构建
图结构设计:将IC前后的病灶(GTV及转移淋巴结)编码为无向完全图,以31个影像组学特征、病灶数量及三维坐标为节点属性;
模型类型:
影像组学模型(model R):基于GCN融合3种MRI序列的深度特征;
临床模型(model C):仅纳入年龄、T分期、N分期、IC前后cfEBV DNA5个临床因素;
影像组学-临床模型(model RC):融合model R的深度特征与model C的临床因素;
对比模型:Cox比例风险回归、卷积神经网络(CNN)、循环神经网络(RNN)。
模型评估与统计分析
性能指标:C指数(预测一致性)、5年ROC曲线下面积(AUC);
风险分层:采用X-tile分析确定model RC评分阈值,将患者分为低风险组与高风险组;
生存分析:Kaplan-Meier法计算生存率,log-rank检验比较差异;
偏倚控制:对CCRT获益分析采用3:1倾向评分匹配平衡基线变量,Bonferroni校正控制I类错误。
04
实验结果图
图 3:模型RC定义的风险组Kaplan-Meier生存曲线
展示训练集、内部验证集、外部验证集中,高危组与低危组在DFS/OS/DMFS/LRRFS上的生存差异。
图 4:不同风险组中CCRT治疗的生存差异曲线
比较低危组和高危组中,是否接受CCRT对DFS/OS/DMFS/LRRFS的影响。
05
讨论
创新点
技术创新:首次将GCN用于整合LA-NPC患者IC前后多时间点MRI数据,适配非欧几里得影像数据的特性,可捕捉病灶间的交互关系,优于仅关注特征数值变化的delta影像组学和不适配非欧几里得数据的RNN。
思路创新:突破传统“治疗前单一时间点预测”局限,基于治疗中(IC后)的动态影像变化构建模型,更贴合肿瘤异质性的动态演化特征。
方法学完善:多中心验证确保模型泛化性,
局限性
研究为回顾性设计,存在患者选择偏倚及治疗方案异质性;
CCRT组与非CCRT组患者数量失衡(CCRT为一线治疗,应用率>90%),可能影响获益分析的稳健性;
转移淋巴结需手动勾勒,耗时且可能引入主观变异;
预测局部区域无复发生存(LRRFS)的性能有限(外部测试集C指数0.72),因调强放疗局部控制率高(>90%),阳性事件少导致模型学习不足。
临床价值
治疗决策优化:明确低风险患者可考虑省略CCRT以减少治疗毒性(如黏膜损伤、吞咽困难)和经济负担,高风险患者需联合更积极的治疗(如免疫治疗、口服卡培他滨辅助化疗);
临床研究支撑:为LA-NPC的风险分层临床试验设计提供工具,推动个体化治疗落地;
生物标志物开发:证实系列MRI影像组学可作为LA-NPC生存预测的非侵入性生物标志物,为动态风险监测奠定基础。
