当前位置: 首页 > news >正文

【中国海洋大学-蔡青组-AAAI26】SEMC:用于超声图像标准平面识别的结构增强型混合专家对比学习


文章:SEMC: Structure-Enhanced Mixture-of-Experts Contrastive Learning for Ultrasound Standard Plane Recognition

代码:https://github.com/YanGuihao/SEMC

单位:中国海洋大学


一、问题背景:超声标准平面识别,难在哪?

超声检查的核心是“找对角度”,但实际操作中难题重重:

  1. 图像本身不“给力”:超声图有斑点噪声、对比度低,器官边界模糊,想精准识别结构本身就难;

  2. 同类不同样,异类却相似:同一标准平面的图像可能因扫描角度、医生操作不同差异显著(比如同一肝脏平面,不同医生拍的样子大相径庭),而不同平面的图像又可能因为边界模糊显得很像,需要精细区分;

  3. 现有AI有短板:之前的AI模型要么只关注深层语义特征,忽略了图像里的浅层结构细节(比如器官轮廓、血管走向),要么没法通过对比学习捕捉到细微差异,导致识别准确率不够稳定。

这些问题直接影响诊断准确性,比如产检中胎儿生长指标测量、肝脏病变筛查等,都可能因标准平面识别不准出现误差。

二、方法创新:SEMC框架+LP2025数据集,双管齐下

为了解决上述痛点,研究团队推出了“SEMC框架”和“LP2025肝脏超声数据集”,核心创新点有两个:

1. SEMC框架:让AI既懂“结构”又懂“区分”

这个框架就像给AI配了“双引擎”,还请了“多位专家”协作:

  • 第一引擎:语义-结构融合模块(SSFM):之前的AI只看深层特征,好比“只见森林不见树木”。这个模块专门把浅层结构细节(比如器官轮廓、血管分支)和深层语义特征(比如这是肝脏左叶、那是门静脉)对齐融合,让AI既能看清细节,又能理解整体;

  • 第二引擎:混合专家对比识别模块(MCRM):相当于给AI安排了3个“专业小助手”,各自专注不同的特征维度,再通过协作做对比学习——既让同类平面的识别结果更统一,又让不同平面的差异更明显。同时还设计了自适应权重机制,不用人工调参,AI能自己根据图像难度调整学习重点。

2. LP2025数据集:填补数据空白

现有公开超声数据集稀缺,研究团队专门打造了高质量肝脏超声数据集:

  • 包含9369张图片,覆盖6种肝脏关键标准平面,还有4626张非标准平面图像(模拟真实临床场景);

  • 所有图片都由5年以上经验的超声医生标注,经过多轮交叉审核、共识验证,确保标签准确,还做了患者信息匿名化处理,兼顾实用性和隐私保护。

三、实验结果:性能碾压主流方法,多场景都好用

研究团队在3个数据集上做了测试,结果都很亮眼:

  1. 胎儿超声数据集(FPUS23):准确率达到95.78%,比第二名的主流模型高0.26%,F1-score更是达到95.06%,在胎儿头、腹部、股骨等标准平面识别中表现突出;

  2. 心脏超声数据集(CAMUS):准确率82.13%,F1-score80.93%,远超其他模型,证明在心脏两腔、四腔等复杂平面识别中同样靠谱;

  3. 自制肝脏数据集(LP2025):准确率82.30%,比现有方法高2.23%,F1-score79.32%,在6种肝脏标准平面和非标准平面的区分中优势明显。

四、优势与局限:实用但仍有提升空间

核心优势

  1. 兼顾细节与整体:首次把浅层结构和深层语义结合,解决了超声图像“细节难辨、同类差异大”的痛点;

  2. 泛化能力强:在胎儿、心脏、肝脏3类不同超声场景中都表现优异,不用针对单一部位重新训练;

  3. 开源共享:代码和数据集都已公开(https://github.com/YanGuihao/SEMC),能推动整个领域的研究进展;

  4. 临床适配性高:数据集包含非标准平面,模拟真实临床环境,模型鲁棒性强,更容易落地应用。

现存局限

  1. 数据范围有限:目前LP2025只覆盖肝脏6种标准平面,未来还需要扩展到更多器官(比如肾脏、甲状腺)和更多临床场景;

  2. 实时性待优化:框架包含多个专家分支和融合模块,虽然准确率高,但推理速度还有提升空间,需要进一步轻量化才能适配超声实时检查的需求;

  3. 极端情况表现未知:对于严重噪声、器官畸形等极端病例,模型的识别效果还需要更多临床数据验证。

五、一句话总结

SEMC框架通过“结构+语义融合”和“多专家对比学习”,解决了超声标准平面识别的核心痛点,搭配开源的高质量LP2025数据集,为临床超声AI辅助诊断提供了更精准、更实用的新方案!

http://www.jsqmd.com/news/174222/

相关文章:

  • 前后端分离校园疫情防控管理系统系统|SpringBoot+Vue+MyBatis+MySQL完整源码+部署教程
  • 开源神器DDColor上线!轻松实现老照片智能彩色化修复
  • 123云盘作为备用渠道,持续提供DDColor资源下载
  • 核心要点:USB 2.0接口定义引脚说明中的阻抗匹配要求
  • 《代码大全2》13,14,15读后感
  • 伯乐在线招聘贴植入:招AI工程师,要求熟悉DDColor等模型
  • 百度贴吧发帖引流:在摄影吧宣传DDColor修复效果
  • 模拟信号隔离技术解析:系统学习指南
  • 同或门在工业控制中的逻辑应用:深度剖析其可靠性设计
  • 为什么选择DDColor做老照片修复?技术优势深度剖析
  • 苹果App Store提交指南:将DDColor封装为iOS应用
  • 全面讲解Proteus元器件大全中的电源与地符号
  • OSCHINA技术博客撰写:提升DDColor社区影响力
  • 在婚恋中实现“先谋爱,更要谋‘靠谱’未来”的需求分析
  • GitHub镜像推荐:DDColor黑白照片修复模型快速部署教程
  • 液冷散热技术应用提升GPU能效比
  • Java Web 校园疫情防控管理系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • CC2530硬件设计避坑指南:新手必看的十大注意事项
  • 思否SegmentFault发文:解决DDColor部署中的典型坑点
  • 《代码大全2》16,17,18读后感
  • 校园志愿者管理系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • 模型蒸馏技术研究压缩DDColor体积便于边缘设备部署
  • 系统学习RS485全双工通信的电气特性与距离限制
  • 微PE官网技术迁移启示:轻量系统也能跑复杂AI模型?
  • OAuth2客户端凭证模式:机器间安全调用DDColor服务
  • 城通网盘限速破解?不如直接购买GPU加速DDColor处理
  • 量化算法优化降低GPU显存占用提升推理速度
  • 2025机顶盒刷机包下载大全:零基础小白指南
  • 【毕业设计】SpringBoot+Vue+MySQL 校园失物招领网站平台源码+数据库+论文+部署文档
  • 《代码大全2》10,11,12读后感