当前位置: 首页 > news >正文

eClinMed 中国人民解放军总医院第五医学中心介入超声科:基于超声的可解释性机器学习模型用于≤3cm肝细胞癌分类的开发与验证

01

文献信息

本次分享的文献是由中国人民解放军总医院第五医学中心介入超声科联合厦门大学附属翔安医院、南开大学医学院和福州市第一总医院超声科等55家医院在2025年2月在柳叶刀子刊《eClinicalMedicine》(中科院1区,IF=10.0)上的研究“Development and validation of an ultrasound-based interpretable machine learning model for the classification of ≤3 cm hepatocellular carcinoma: a multicentre retrospective diagnostic study”即基于超声的可解释性机器学习模型用于≤3 cm 肝细胞癌分类的开发与验证:一项多中心回顾性诊断研究,开发并验证一种基于灰度超声(grayscale US)的机器学习模型(Model URC),用于区分≤3 cm的小肝细胞癌(sHCC)与非HCC肝病灶,结合超声语义特征、影像组学(radiomics)及临床数据,提升小肝癌的早期诊断准确性。

Fig. 2:机器学习模型开发与验证工作流

分模块呈现模型构建全链条,涵盖特征提取、模型开发、评估与解释三大环节:

特征提取层

临床文本特征:年龄、性别、肝炎病史、肿瘤病史等;

超声特征:肿瘤大小、形态、回声等语义特征;

放射组学特征:基于DICOM格式超声图像,经ITK-SNAP勾勒ROI后,通过PyRadiomics提取微观特征。

模型开发层:基于三类特征组合构建递进式模型——

ModelU:仅纳入超声特征;

ModelUR:超声特征+放射组学特征;

ModelURC:超声特征+放射组学特征+临床特征。

评估与解释层

模型评估:内部/外部验证、亚组分析(肿瘤大小、HCC风险、肝脏背景)、人机对比;

可解释性分析:采用SHAP算法解析特征重要性。

02

研究背景及目标

研究背景

疾病负担:肝细胞癌(HCC)占原发性肝癌的90%,为全球第四大癌症相关死亡原因;≤3cm的sHCC早期诊断可扩大治疗窗口、改善预后。

现有诊断局限:增强超声(CEUS)、CT、MRI等精准诊断方法存在成本高、耗时长、有创/辐射风险等问题;灰度超声作为一线筛查手段,因特异性低、缺乏动态灌注特征、高度依赖医生经验,诊断sHCC的灵敏度仅53%,易漏诊。

研究缺口:现有AI诊断研究多基于MRI,且样本量有限,尚无针对≤3cm sHCC的灰度超声AI诊断模型。

研究目标

开发基于灰度超声的机器学习模型,实现≤3cmsHCC与非HCC病灶的精准鉴别。

比较不同特征组合模型(超声、超声+放射组学、超声+放射组学+临床)的诊断性能,筛选最优模型。

验证最优模型在多中心数据中的稳健性,并与不同经验放射科医生的诊断性能对比。

通过SHAP算法解析最优模型的特征重要性,提升模型临床可解释性。

03

数据和方法

研究数据

数据来源与时间

纳入2017年5月至2021年6月中国55家医院的连续患者,经筛选后形成1058个≤3cm肝脏病灶(来自1052例患者)。

数据分组

训练集:597个病灶(41家医院597例患者),用于模型开发。

内部验证集:149个病灶(41家医院149例患者),按8:2比例随机从训练集来源数据中划分,用于初步验证。

外部验证集:312个病灶(14家独立医院306例患者),用于模型泛化性验证。

纳入与排除标准

纳入标准:①病灶良恶性经病理/细胞学证实,或血管瘤、局灶性结节增生经CT/MRI+1年以上随访证实;②病灶≤3cm,数量≤3个;③临床数据完整;④活检/手术前1个月内完成灰度超声检查。

排除标准:①病理诊断不明确(血管瘤、局灶性结节增生除外);②临床数据不全;③超声图像缺失或质量差。

数据特征

超声语义特征:肿瘤大小、形态、边界、回声水平、血流信号等11项指标。

放射组学特征:通过ITK-SNAP勾勒病灶ROI,用PyRadiomics提取多维度特征。

临床特征:年龄、性别、肝炎病史、肿瘤病史等。

Fig. 1:患者与结节纳入排除流程图


技术方法

特征处理

采用Z-score归一化标准化特征,Spearman相关系数剔除相关系数>0.9的冗余特征;通过LASSO回归筛选非零系数特征,构建特征签名。

模型开发与筛选

基于8种机器学习算法(逻辑回归、随机森林、XGBoost、MLP等)开发3个模型:

ModelU:仅纳入超声语义特征。

ModelUR:纳入超声语义特征+放射组学特征。

ModelURC:纳入超声语义特征+放射组学特征+临床特征。

以AUC为核心指标,筛选各特征组合下的最优算法模型。

性能评估与对比

模型验证:采用AUC、灵敏度、特异性、准确率等指标,在内部及外部验证集中评估模型性能;通过分层分析(肿瘤大小≤2cmvs2.1-3cm、高HCC风险vs低风险、肝硬化vs非肝硬化)验证模型稳健性。

人机对比:3名初级(<5年经验)及3名高级(>5年经验)放射科医生分别在“无模型辅助”和“ModelURC辅助”下诊断外部验证集病灶,比较诊断性能差异。

模型可解释性与统计分析

用SHAP算法(树解释器)解析最优模型的特征重要性,绘制SHAP summary plot及waterfall plot;采用Python、R、SPSS进行数据分析,Delong检验比较AUC,McNemar检验比较诊断准确性,P<0.05为差异有统计学意义。

04

实验结果图

Fig. 3:三类模型在不同队列的ROC曲线

ModelU(仅超声)、ModelUR(超声+影像组学)、ModelURC(全特征)在训练集(A)、内部验证集(B)、外部验证集(C)的AUC对比。

Fig. 4:ModelURC的亚组分层ROC曲线

按肿瘤大小(≤2.0cmvs.2.1–3.0cm)和肝癌风险(高危vs.低危)分层评估AUC。

Fig. 5:模型临床实用性评估图

5A校准曲线:ModelURC曲线接近理想对角线,提示预测值与真实值一致性好。

5BNRI(净重分类指数):显示ModelURC显著优于前两种模型。

5C决策曲线(DCA):ModelURC在各阈值下均显示出最高的净获益。

5DIDI(综合判别改善指数):进一步确认ModelURC相对优势。

Fig. 6:ModelURC与放射科医生的性能对比ROC曲线

Fig. 7:ModelURC的SHAP解释图

A:特征重要性排序;B:代表性HCC病例超声图;C:该病例SHAP瀑布图

05

讨论

创新点

研究填补空白:首次针对≤3cm sHCC,开发基于灰度超声的AI诊断模型,解决了现有研究多依赖MRI、样本量小的问题。

特征融合思路:构建递进式特征组合模型,证实“超声语义特征+放射组学+临床特征”的融合能显著提升诊断性能,为超声AI模型开发提供范式。

多中心验证与可解释性:基于55家医院大样本验证模型稳健性,同时通过SHAP算法破解机器学习“黑箱”问题,增强临床信任度。

临床实用导向:直接对比模型与不同经验医生的性能,证实模型可缩小医生经验差异,降低诊断对专家依赖。

局限性

样本选择偏倚:良性病灶因缺乏病理证实而样本量不足,且非HCC病例多为非肝硬化背景,可能影响模型对肝硬化背景下良性病灶的鉴别能力。

地域局限性:数据均来自中国医院,缺乏国际多中心外部验证,模型在其他人群中的泛化性需进一步验证。

临床价值

提升筛查效能:将灰度超声诊断sHCC的灵敏度从53%提升至92.8%,减少漏诊,助力早期干预。

优化诊疗流程:降低对CEUS、CT等昂贵检查的依赖,减少患者经济负担与辐射/有创风险,加速患者进入治疗阶段。

平衡医疗资源:通过模型辅助缩小不同经验医生的诊断差距,尤其适用于基层医疗机构,提升同质化诊断水平。

推动AI临床转化:可解释性设计降低了临床应用门槛,为超声AI模型融入常规诊疗提供了可行路径。

http://www.jsqmd.com/news/880095/

相关文章:

  • 为什么你的DeepSeek工具调用总是超时?揭秘底层Tool Executor线程池配置的2个致命默认值及修复代码
  • CentOS 7服务器上,从禁用Nouveau到成功点亮NVIDIA显卡的保姆级实录
  • 用ChatGPT做动态仪表盘?先绕过这8个API响应陷阱——附12个经生产环境验证的Viz-Ready Prompt模板
  • 【信息科学与工程学】计算机科学与自动化——第六十二篇 虚拟化算法02
  • Python 开发者如何通过 Taotoken 快速接入多款大模型 API
  • 保姆级教程:从黑屏闪退到流畅狂飙,搞定Win11下NFS21运行库问题
  • 鸿蒙PC:Qt适配OpenHarmony实战【水印日记】:用 Qt Quick 做一个本地喝水进度记录
  • Radiol Artif Intell 中山大学肿瘤防治中心放疗科:基于连续MRI的深度学习模型预测局部晚期鼻咽癌患者生存期
  • 【独家首发】Gemini KYC与Chainlink预言机深度集成方案:实现链上身份凭证自动验真(含Solidity验证合约片段)
  • 机器学习优化3D打印热电材料:从墨水配方到性能闭环
  • 《彻底搞懂RAG技术:解决大模型幻觉,落地企业AI应用的核心方案》
  • CentOS 7.9下Lustre 2.12.9集群部署避坑指南:从内核安装到ZFS配置的完整流程
  • IPSec CA证书体系搭建与生产运维实战指南
  • 【审计专栏】【财务领域】第二十八篇 全球/中国货币流动中离钱最近的岗位01
  • 安卓高版本APP抓包失败原因与BurpSuite+雷电模拟器9实战绕过指南
  • 自适应能量对齐:提升电子态密度机器学习预测精度的关键技术
  • 告别卡顿!用scrcpy v2.0无线投屏小米/华为手机到Windows电脑的保姆级教程
  • 不变性学习自适应算法:从VC维到样本效率的理论与实践
  • 2026 四川钢管优质供应商推荐|盛世钢联全品类现货批发,价格行情与采购指南 - 四川盛世钢联营销中心
  • Linux端口敲门实战:用knockd为SSH加一道协议层保险
  • Windows 彻底关闭 UAC 弹窗:让你的管理员账户获得超级管理员权限
  • 基于随机森林与KL散度的并行MCMC:大数据贝叶斯计算新范式
  • 静电筛选与机器学习势函数加速:高通量预测材料分裂空位缺陷
  • 每日大赛场景下如何快速接入多模型API提升开发效率
  • DeepSeek总结的DuckDB动态函数应用插件
  • Rust内存安全特性:所有权、借用与生命周期详解
  • 无服务器架构与Serverless
  • 2026年05月河北水墨印刷开槽机厂商推荐,选型不迷茫,纸箱包装机械/水墨印刷开槽机,水墨印刷开槽机品牌推荐 - 品牌推荐师
  • DeepSeek总结的clickhousectl v0.2.0: Postgres, ClickPipes 等更多功能
  • 2026亲测:专业降AI率平台选这款就对了