当前位置: 首页 > news >正文

Nature 子刊重磅!砂型铸造图像分割开源数据集,破解工业 4.0 自动化难题

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12575604/pdf/41597_2025_Article_6007.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

本文提出全球首个面向砂型铸造浇口 / 冒口分割的综合图像数据集,融合真实拍摄、3D 合成、数据增强三类图像,已开源至 Kaggle,直接为工业图像分割模型训练提供 “现成弹药”。

PART/1

痛点

行业困局:HMLV 铸造厂的自动化拦路虎

  1. 劳动力危机:美国 2030 年预计 210 万制造岗位空缺,铸造行业人才断层严重,人工成本持续攀升;
  2. 工艺痛点:多品种小批量模式下,零件形状、浇口 / 冒口位置无统一标准,人工切割无法规模化,传统自动化设备难以适配;
  3. 数据空白:工业场景缺乏专用的砂铸分割标注数据集,AI 模型无高质量数据支撑,分割精度始终上不去。

PART/2

数据集

数据集构建:三位一体的工业视觉数据体系

研究团队打造真实图像 + 合成图像 + 增强图像三维数据集,总计 3240 张标注图像,全面覆盖砂铸场景的 variability。

1.铸件样本制备:3D 打印简易铸件模具,采用 6061 铝合金浇筑 30 个差异化样本;

砂型铸造制作流程

2.真实图像采集:用 Arduino 相机 + 3D 打印转台,360° 每 20° 拍摄,单样本 36 张图,共生成 1080 张真实相机图;

图像采集装置

3.3D 扫描选型:优选 Einscan Pro HD 白光扫描仪,1 分钟完成高精度扫描,效率远超同类设备;

3D 扫描仪工作图

4.合成与增强:通过 Blender 渲染生成 1080 张合成图、1080 张增强图,统一铝材质感保证视觉一致性;

5.精准标注:用 Roboflow 平台标注零件、浇口、冒口三类目标,生成 YOLO 格式分割掩码。

Roboflow 标注示例

PART/3

实验

质量核验:四大指标锚定数据可靠性

为验证数据有效性,团队用 4 大核心指标量化图像质量,同时通过颜色空间变换(CST)提升数据鲁棒性:

  1. 香农熵:衡量图像信息含量,真实图信息丰富度最优;
  2. GLCM 纹理特征:评估对比度、能量、均匀性等纹理属性;
  3. 固有维度(ID):量化数据集整体复杂度;
  4. SSIM 结构相似性:评估图像失真对结构信息的影响

不同失真类型的 SSIM 值

颜色空间变换示例

无颜色变换的图像质量对比

颜色空间变换后数据对比

核心结论:颜色空间变换能有效缩小真实图与合成 / 增强图的质量差距,让合成数据更适配工业 AI 模型训练。

PART/4

优势

实测出圈:合成数据训练效果媲美真实图

团队采用 YOLOv8、MaskRCNN 等主流分割模型测试,纯合成数据训练的模型 mAP@50 达 0.978,超越真实图训练效果,综合性能最优。

模型训练性能结果

开源福利(直接可用)

  1. 数据集、转台控制代码、Blender 渲染脚本全开源至 Kaggle;

  2. 标注格式兼容 YOLO、MaskRCNN 等主流框架,下载即训;

  3. 完美适配 HMLV 铸造厂场景,快速落地浇口 / 冒口去除自动化。

结语

这份专用工业数据集,填补了砂型铸造图像分割的数据空白,为工业 4.0 背景下的小批量制造自动化提供了关键支撑。从数据到模型,再到现场落地,智能制造的最后一公里,终于有了可落地的解题思路。



有相关需求的你可以联系我们!

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


往期推荐

🔗

  • YOLO-TLA:一种基于 YOLOv5 的高效轻量级小目标检测模型

  • ViT-YOLO:基于Transformer的用于目标检测的YOLO算法

  • SSMA-YOLO:一种轻量级的 YOLO 模型,具备增强的特征提取与融合能力,适用于无人机航拍的船舶图像检测

  • LUD-YOLO:一种用于无人机的新型轻量级目标检测网络

  • Gold-YOLO:基于聚合与分配机制的高效目标检测器

  • Drone-YOLO:一种有效的无人机图像目标检测

  • 「无人机+AI」“空中城管”

  • 无人机+AI:光伏巡检自动化解决方案

  • 无人机视角下多类别船舶检测及数量统计

  • 机场项目:解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题

  • 2PCNet:昼夜无监督域自适应目标检测(附原代码)

  • YOLO-S:小目标检测的轻量级、精确的类YOLO网络

  • 大改Yolo框架 | 能源消耗极低的目标检测新框架(附论文下载)

  • 改进的检测算法:用于高分辨率光学遥感图像目标检测

http://www.jsqmd.com/news/829102/

相关文章:

  • Burp Suite社区版保姆级入门:从零配置代理到抓取第一个HTTPS请求
  • 5.16 构造题总结
  • LabVIEW事件结构:从轮询到事件驱动的界面编程实战指南
  • 别再只装CUDA了!Windows 10深度学习环境搭建:CUDA、cuDNN与PyTorch/TensorFlow的版本‘婚姻’全解析
  • 基于 YOLO 的城市河流漂浮垃圾实时计数:为防洪与水资源管理装上 “AI 慧眼”
  • Educoder实战:从零到一,在Linux上快速搭建并配置vsftpd FTP服务器
  • 玩转 gpgpu-sim 02记 —— 容器化初体验
  • 火灾模拟终极指南:3步掌握Fire Dynamics Simulator实战技巧
  • Anthropic 内部数百个 Claude Code Skills,他们总结的这套方法值得看
  • 如何快速掌握终极鼠标悬停翻译神器:MouseTooltipTranslator完整使用指南
  • 深度解析Gopeed下载架构:从HTTP 403错误处理到性能优化的完整实践
  • 2026年宁夏短视频代运营与一站式网络营销服务商深度横评:企业怎么选 - 年度推荐企业名录
  • 光刻技术中光束聚焦优化方法与工艺窗口提升
  • AI率超标?手把手教你从100%降到0%! - AI论文先行者
  • 2026年银川企业短视频代运营与一站式网络营销服务商深度评测指南 - 年度推荐企业名录
  • Ubuntu系统下nvidia-container-toolkit-base安装报错排查与修复指南
  • 终极散热优化指南:如何用G-Helper解决华硕笔记本过热问题
  • 企业级自托管AI平台部署实战:Open WebUI架构深度解析与安全部署方案
  • 话费卡回收技巧:轻松兑换现金的最佳攻略! - 团团收购物卡回收
  • 从Faster R-CNN到Oriented R-CNN:一文看懂旋转目标检测的演进与核心改进
  • 浙江保温杯制管机/拉管机/生产线厂家实力评测:浙江强锐机械,凭什么成为杯壶设备领域的“隐形冠军”? - 企业品牌优选推荐官
  • 天津祥和景观工程:南开专业的绿植养护找哪家 - LYL仔仔
  • 基于多模态AI的视频智能剪辑:从CLIP模型到工程实践
  • 别再自己写FFT了!实测CUDA的cuFFT库比FFTW快10倍(附VS2010环境配置避坑指南)
  • Virtual-ZPL-Printer:5分钟搭建你的虚拟条码打印机,告别硬件依赖!
  • 2026年电力变压器厂家推荐:升压/降压/油浸式/干式/矿用电力变压器专业供应商选型指南 - 品牌推荐官
  • 别再乱勾Static了!Unity光照烘焙从入门到放弃的5个关键设置(含Lighting Mode选择指南)
  • Xenos:Windows平台高效DLL注入工具的5大核心优势解析
  • 2026年银川短视频代运营与企业AI推广5大服务商深度横评:如何找到真正懂行业的合作伙伴 - 年度推荐企业名录
  • 构建结构化技能知识库:Markdown+Git实现团队知识沉淀与高效复用