JAMA Netw Open(IF=9.7)美国埃默里大学等团队:基于CT的原发肿瘤和转移性颈部淋巴结深度学习模型用于口咽癌结局预测
01
文献学习
今天分享的文献是由美国埃默里大学等团队于2025年5月在《JAMA Network Open》(中科院1区top,IF=9.7)上发表的研究“Deep Learning Model of Primary Tumor and Metastatic Cervical Lymph Nodes From CT for Outcome Predictions in Oropharyngeal Cancer”即基于CT的原发肿瘤和转移性颈部淋巴结深度学习模型用于口咽癌结局预测,该研究开发并验证了一个基于CT的深度学习分类器(SwinScore),通过整合原发肿瘤和转移性颈部淋巴结的影像特征,预测p16+口咽鳞癌患者的生存结局(无病生存、总生存、局部区域失败),并识别出可能从化疗中获得额外益处的I期患者。研究使用811例患者的多中心数据,模型在外部测试集中表现出良好的预后效能(C-index=0.63),并发现化疗仅对高风险评分患者有显著获益。
创新点:①融合原发灶与淋巴结:首次利用深度学习整合原发肿瘤及转移淋巴结CT特征,而非单独分析。②跨区域自注意力交互:采用Swin Transformer架构捕捉原发灶与淋巴结间的影像特征交互。③预测化疗附加获益:模型不仅预测预后,还能识别I期患者中可从化疗中获益的亚群。
临床价值:①精准风险分层:将患者显著划分为高低风险组,优于传统TNM分期,指导个体化治疗。②避免过度治疗:识别低风险患者,支持降阶治疗决策,减少放化疗毒副反应。③优化I期患者管理:为目前推荐降阶治疗的I期患者提供化疗获益的补充证据。
02
研究背景和目的
研究背景
p16阳性口咽鳞状细胞癌(p16+ OPSCC)的发病率持续上升,导致年轻幸存者群体日益扩大,因此治疗后的生活质量成为临床关注的核心问题。尽管大多数p16+ OPSCC肿瘤进展相对缓慢,理论上可能从治疗降级(如减少放疗剂量或省略化疗)中获益,但既往研究显示,缺乏精准患者筛选的降级策略反而可能导致预后恶化。同时,化疗虽然能够改善部分患者的生存,却也会带来显著的急性和长期毒性反应,尤其对于低复发风险患者可能得不偿失。目前临床广泛采用的第8版AJCC TNM分期系统虽能基于原发肿瘤(T)和淋巴结(N)进行风险分层,但其在量化瘤内和淋巴结内异质性方面存在明显局限,无法充分反映肿瘤生物学行为的细微差异。常规治疗前CT扫描已广泛用于OPSCC的预后评估,但既往大多数深度学习研究仅聚焦于原发肿瘤区域,而忽略了转移性颈部淋巴结所携带的关键预后信息,更缺乏将两者特征进行有效融合的联合分析。因此,亟需开发一种非侵入性的影像学生物标志物,能够同时整合原发肿瘤与转移淋巴结的多区域成像特征,从而实现更精准的风险分层,指导个体化治疗决策。
研究目的
本研究旨在开发并验证一个基于治疗前CT影像的深度学习多区域成像风险评分(SwinScore),该评分采用层级视觉变换器(Swin Transformer)架构,专门用于融合原发肿瘤与转移性颈部淋巴结的成像特征,以预测p16+ OPSCC患者的生存结局,包括无病生存期(DFS)、总生存期(OS)和局部区域失败(LRF)。研究进一步评估该评分在与单独使用原发肿瘤或淋巴结模型、传统临床模型以及17种已有先进模型对比中的预后性能优劣。此外,研究还重点探索SwinScore是否能够识别出在AJCC第8版I期及II期患者中可能从化疗中获得额外生存获益的亚群,从而为治疗强度调整(如降级或升级)提供决策依据。通过在811例患者的多中心队列中进行训练、内部验证和外部测试,并使用C指数、校准曲线、决策曲线分析以及SHAP值解释性分析等统计方法,研究旨在验证该评分作为独立预后因子的稳健性,并明确其在优化个体化治疗策略、减少过度治疗方面的潜在临床价值。
03
数据和方法
研究数据
总样本量:811例p16+ OPSCC 患者
数据来源:
TCIA(癌症影像档案):522例(训练集+内部验证集)
克利夫兰诊所(CCF):233例
Winship癌症研究所:56例
(后两者合并为外部测试集)
时间跨度:1998–2015年
治疗方式:根治性放疗或同步放化疗
结局事件:无病生存(DFS)、总生存(OS)、局部区域失败(LRF)
技术方法
深度学习架构:Swin Transformer (v2.0),采用分层视觉Transformer,分别提取原发肿瘤和转移淋巴结特征,并通过交叉区域自注意力机制融合。
训练目标:预测3年DFS,使用二元交叉熵损失,输出连续风险评分(SwinScore)。
风险分组:以训练集中位数(-0.5)为界,分为高/低风险组。
统计分析:Kaplan-Meier曲线、log-rank检验、C-index、多变量Cox回归、SHAP值、决策曲线分析、校准曲线、交互作用检验等。
04
实验结果
预后效能(外部测试集):
DFS:HR=3.76 (95% CI: 1.99–7.10), P<0.001, C-index=0.63
OS:HR=4.80 (95% CI: 2.22–10.40), P<0.001, C-index=0.63
LRF:HR=4.47 (95% CI: 1.43–14.00), P=0.01, C-index=0.63
多区域优势:SwinScore的C-index (0.63) 高于仅用原发灶 (0.61) 或仅用淋巴结 (0.58) 的模型。
独立预测因子:多变量Cox回归显示SwinScore是DFS和OS的独立预后因素(P=0.002, 0.003),SHAP值排序第一。
化疗获益预测:
高风险患者:化疗+放疗 vs 单纯放疗,DFS HR=0.09 (P=0.004)
低风险患者:两组治疗方式DFS无显著差异(HR=0.83, P=0.69)
交互作用检验显著(P=0.03 和0.008)
基因关联:模型倒数第二层特征与免疫相关通路显著相关,提供了生物学可解释性。
图 1:多区域影像风险评分的预后价值
图 1包含四个子图,展示了SwinScore在外部测试集(D3)中的预后表现。图A为无病生存(DFS)的Kaplan-Meier曲线,高风险组与低风险组之间风险比(HR)为3.76(95% CI: 1.99-7.10),C指数0.63,P<0.001,表明模型能显著区分两组患者的复发风险。图B为总生存(OS)曲线,HR高达4.80(95% CI: 2.22-10.40),同样显示高风险组生存率显著更低。图C为局部区域失败(LRF)曲线,HR为4.47,P=0.01,提示模型对局部复发亦有预测能力。图D为SHAP值蜂群图,显示SwinScore是影响DFS的最重要变量,其重要性超过吸烟包年、T分期、N分期等传统临床因素,验证了该影像生物标志物的独立预后价值。
图 2:集成梯度注意力图与模型可解释性
图 2展示了通过集成梯度方法生成的注意力热力图,叠加于原始CT图像之上。图中清晰显示,模型关注的高亮区域与放射科医生手动标注的原发肿瘤(PT)和转移性颈部淋巴结(LN)位置高度吻合。这些热力图证明了深度学习模型并非依赖噪声或无关背景进行预测,而是自动学习并聚焦于肿瘤及其转移灶的影像学特征。通过可视化模型决策的关键区域,显著增强了深度学习的可解释性,使临床医生能够信任模型所捕捉到的生物学相关模式,为后续基于影像的风险分层提供了直观的病理生理学支持。
图 3:SwinScore作为化疗获益的预测生物标志物
图 3通过四个Kaplan-Meier子图分析了SwinScore与化疗获益的关联。图A和图B基于训练集:在高风险患者中,接受放化疗者的DFS显著优于单纯放疗者(HR=0.09,P=0.004),而低风险患者的两组间无显著差异(HR=0.83,P=0.69)。图C和图D基于内部验证集与外部测试集:同样,高风险患者从化疗中显著获益(HR=0.19,P=0.03),低风险患者则无获益(HR=0.78,P=0.56)。交互检验P值分别为0.03和0.008,证实SwinScore可预测化疗的附加获益,尤其有助于识别AJCC 8版I期患者中真正需要治疗强化的高危人群。
05
研究结论
该研究开发并验证了一种基于CT影像的深度学习多区域影像风险评分(SwinScore),该模型整合了p16+口咽鳞状细胞癌患者的原发肿瘤与转移性颈部淋巴结的影像特征。研究纳入811例患者,结果显示该评分能显著预测患者的无病生存期、总生存期和局部区域失败,其预测性能优于单独使用原发肿瘤或淋巴结的模型。更重要的是,SwinScore在AJCC第8版I期患者中能够识别出从化疗中获得额外生存获益的高风险人群,而低风险患者则未能显示化疗的显著优势。此外,多变量分析证实该评分为独立预后因子,其重要性甚至超过传统临床变量。尽管模型可解释性有限且为回顾性研究,但该影像标志物有望实现对p16+口咽癌患者的精细风险分层,指导治疗降级或强化策略,避免过度治疗,推动个体化精准医学在头颈部肿瘤中的应用。
参考文献:Song B, Leroy A, Yang K, Khalighi S, Pandav K, Dam T, Lee J, Stock S, Li XT, Sonuga J, Fu P, Koyfman S, Saba NF, Patel MR, Madabhushi A. Deep Learning Model of Primary Tumor and Metastatic Cervical Lymph Nodes From CT for Outcome Predictions in Oropharyngeal Cancer. JAMA Netw Open. 2025 May 1;8(5):e258094. doi: 10.1001/jamanetworkopen.2025.8094.
