当前位置：首页 > news >正文

【中国海洋大学-蔡青组-AAAI26】SEMC：用于超声图像标准平面识别的结构增强型混合专家对比学习

news 2026/7/6 22:04:13

文章：SEMC: Structure-Enhanced Mixture-of-Experts Contrastive Learning for Ultrasound Standard Plane Recognition

代码：https://github.com/YanGuihao/SEMC

单位：中国海洋大学

一、问题背景：超声标准平面识别，难在哪？

超声检查的核心是“找对角度”，但实际操作中难题重重：

图像本身不“给力”：超声图有斑点噪声、对比度低，器官边界模糊，想精准识别结构本身就难；
同类不同样，异类却相似：同一标准平面的图像可能因扫描角度、医生操作不同差异显著（比如同一肝脏平面，不同医生拍的样子大相径庭），而不同平面的图像又可能因为边界模糊显得很像，需要精细区分；
现有AI有短板：之前的AI模型要么只关注深层语义特征，忽略了图像里的浅层结构细节（比如器官轮廓、血管走向），要么没法通过对比学习捕捉到细微差异，导致识别准确率不够稳定。

这些问题直接影响诊断准确性，比如产检中胎儿生长指标测量、肝脏病变筛查等，都可能因标准平面识别不准出现误差。

二、方法创新：SEMC框架+LP2025数据集，双管齐下

为了解决上述痛点，研究团队推出了“SEMC框架”和“LP2025肝脏超声数据集”，核心创新点有两个：

1. SEMC框架：让AI既懂“结构”又懂“区分”

这个框架就像给AI配了“双引擎”，还请了“多位专家”协作：

第一引擎：语义-结构融合模块（SSFM）：之前的AI只看深层特征，好比“只见森林不见树木”。这个模块专门把浅层结构细节（比如器官轮廓、血管分支）和深层语义特征（比如这是肝脏左叶、那是门静脉）对齐融合，让AI既能看清细节，又能理解整体；
第二引擎：混合专家对比识别模块（MCRM）：相当于给AI安排了3个“专业小助手”，各自专注不同的特征维度，再通过协作做对比学习——既让同类平面的识别结果更统一，又让不同平面的差异更明显。同时还设计了自适应权重机制，不用人工调参，AI能自己根据图像难度调整学习重点。

2. LP2025数据集：填补数据空白

现有公开超声数据集稀缺，研究团队专门打造了高质量肝脏超声数据集：

包含9369张图片，覆盖6种肝脏关键标准平面，还有4626张非标准平面图像（模拟真实临床场景）；
所有图片都由5年以上经验的超声医生标注，经过多轮交叉审核、共识验证，确保标签准确，还做了患者信息匿名化处理，兼顾实用性和隐私保护。

三、实验结果：性能碾压主流方法，多场景都好用

研究团队在3个数据集上做了测试，结果都很亮眼：

胎儿超声数据集（FPUS23）：准确率达到95.78%，比第二名的主流模型高0.26%，F1-score更是达到95.06%，在胎儿头、腹部、股骨等标准平面识别中表现突出；
心脏超声数据集（CAMUS）：准确率82.13%，F1-score80.93%，远超其他模型，证明在心脏两腔、四腔等复杂平面识别中同样靠谱；
自制肝脏数据集（LP2025）：准确率82.30%，比现有方法高2.23%，F1-score79.32%，在6种肝脏标准平面和非标准平面的区分中优势明显。

四、优势与局限：实用但仍有提升空间

核心优势

兼顾细节与整体：首次把浅层结构和深层语义结合，解决了超声图像“细节难辨、同类差异大”的痛点；
泛化能力强：在胎儿、心脏、肝脏3类不同超声场景中都表现优异，不用针对单一部位重新训练；
开源共享：代码和数据集都已公开（https://github.com/YanGuihao/SEMC），能推动整个领域的研究进展；
临床适配性高：数据集包含非标准平面，模拟真实临床环境，模型鲁棒性强，更容易落地应用。

现存局限

数据范围有限：目前LP2025只覆盖肝脏6种标准平面，未来还需要扩展到更多器官（比如肾脏、甲状腺）和更多临床场景；
实时性待优化：框架包含多个专家分支和融合模块，虽然准确率高，但推理速度还有提升空间，需要进一步轻量化才能适配超声实时检查的需求；
极端情况表现未知：对于严重噪声、器官畸形等极端病例，模型的识别效果还需要更多临床数据验证。

五、一句话总结

SEMC框架通过“结构+语义融合”和“多专家对比学习”，解决了超声标准平面识别的核心痛点，搭配开源的高质量LP2025数据集，为临床超声AI辅助诊断提供了更精准、更实用的新方案！

http://www.jsqmd.com/news/174222/

相关文章：

前后端分离校园疫情防控管理系统系统｜SpringBoot+Vue+MyBatis+MySQL完整源码+部署教程

开源神器DDColor上线！轻松实现老照片智能彩色化修复

123云盘作为备用渠道，持续提供DDColor资源下载

核心要点：USB 2.0接口定义引脚说明中的阻抗匹配要求

《代码大全2》13，14，15读后感

伯乐在线招聘贴植入：招AI工程师，要求熟悉DDColor等模型

百度贴吧发帖引流：在摄影吧宣传DDColor修复效果

模拟信号隔离技术解析：系统学习指南

同或门在工业控制中的逻辑应用：深度剖析其可靠性设计

为什么选择DDColor做老照片修复？技术优势深度剖析

苹果App Store提交指南：将DDColor封装为iOS应用

全面讲解Proteus元器件大全中的电源与地符号

OSCHINA技术博客撰写：提升DDColor社区影响力

在婚恋中实现“先谋爱，更要谋‘靠谱’未来”的需求分析

GitHub镜像推荐：DDColor黑白照片修复模型快速部署教程

液冷散热技术应用提升GPU能效比

Java Web 校园疫情防控管理系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

CC2530硬件设计避坑指南：新手必看的十大注意事项

思否SegmentFault发文：解决DDColor部署中的典型坑点

《代码大全2》16，17，18读后感

校园志愿者管理系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

模型蒸馏技术研究压缩DDColor体积便于边缘设备部署

系统学习RS485全双工通信的电气特性与距离限制

微PE官网技术迁移启示：轻量系统也能跑复杂AI模型？

OAuth2客户端凭证模式：机器间安全调用DDColor服务

城通网盘限速破解？不如直接购买GPU加速DDColor处理

量化算法优化降低GPU显存占用提升推理速度

2025机顶盒刷机包下载大全：零基础小白指南

【毕业设计】SpringBoot+Vue+MySQL 校园失物招领网站平台源码+数据库+论文+部署文档

《代码大全2》10，11，12读后感