当前位置: 首页 > news >正文

工业异常检测的PatchCore方法

前某机构实习生Karsten Roth获得EMVA青年专业人士奖

计算机视觉

前某机构实习生Karsten Roth获得EMVA青年专业人士奖

EMVA青年专业人士奖旨在表彰“学生或青年专业人士在机器视觉或图像处理领域的杰出创新工作”。

作者:Staff writer,2022年6月23日

3分钟阅读

会议

CVPR 2022

相关出版物

《迈向工业异常检测中的完全召回》

图宾根大学博士生Karsten Roth因其在某机构科学实习期间完成的《迈向工业异常检测中的完全召回》工作,荣获EMVA青年专业人士奖。Roth于5月13日在布鲁塞尔举行的第20届EMVA商业会议上接受了该奖项。

EMVA青年专业人士奖是一个年度奖项,“旨在表彰学生或青年专业人士在机器视觉或图像处理领域的杰出创新工作。”

Roth与应用科学家Latha Pemula、前高级应用科学家Joaquin Zepeda、副总裁兼杰出科学家Bernhard Schölkopf、某机构学者Thomas Brox以及高级应用科学家(也是Roth的导师)Peter Gehler共同撰写的论文,解决了异常检测中所谓的“冷启动”问题。

“该项目是为后来成为某机构Lookout for Vision的服务而开展的,该服务帮助企业(通常是制造商)发现缺陷和异常。”Gehler解释道。Lookout for Vision利用了少样本学习,这意味着只需相对少量的缺陷和正常产品示例即可评估产品缺陷。然而,当企业只有正常(非缺陷)产品图像可用时,挑战就出现了。

“我们研究的问题是冷启动问题,即没有任何负样本或缺陷示例。”Gehler说。这一挑战还扩展到检测难以捕捉的缺陷(如细微划痕或缺失部件)以及发现不可预见的缺陷。

“我们的研究源于一个真实且实际的挑战。”Roth解释说,“我们开发的解决方案必须是实用型的;在考虑‘学术上的惊艳因素’之前,优先优化性能和可用性。”

团队通过利用无缺陷物品的图像找到了解决该挑战的方案。“我们研究了许多变体。”Gehler说,“最佳方案是基于建立一个正常示例的图像库,然后针对该库测试待测图像的‘接近度’。”Gehler指出,接下来的问题是如何定义“接近度”。

“是否接近某个示例取决于你如何获取图像以及如何编码图像。”他说。他补充道,借鉴深度学习架构的原理,解决方案是“将图像转换为一系列向量,然后比较这些向量——在多个阶段有多种方式可以做到这一点。”通过将产品与无缺陷示例进行比较,并判断产品离理想状态的接近或偏离程度,即使没有实际的缺陷示例,也可以标记出缺陷。

团队的解决方案PatchCore在广泛使用的MVTec AD基准测试上实现了高达99.6%的图像级异常检测(AUROC)分数,“与次优的竞争对手相比,错误率减少了一半以上”。Roth在本周的CVPR 2022上展示了PatchCore。

Gehler表示Roth的作用至关重要。“Karsten每周产出的结果多到我们在一小时的周会上都来不及全部讨论完。”

“获得今年的EMVA青年专业人士奖,进一步验证了这项研究的相关性和重要性,我很高兴能获得这样一个高知名度的奖项。”Roth说。

他补充说,他非常感谢在某机构实习期间所在的团队。“在某机构进行研究的一个意想不到但非常受欢迎的收获是,我的代码质量和研究进展的整体文档记录都得到了显著提升,”他说,“特别感谢Peter,他让整个研究实习经历变得非常棒。”

某机构科学实习
某机构正在积极寻找经济学、机器人学、深度学习等领域的科学实习生。

研究领域

计算机视觉

标签

奖项与表彰、异常检测、实习、CVPRFINISHED
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

http://www.jsqmd.com/news/599367/

相关文章:

  • 2026年游戏测试品牌怎么选:成都大模型测试/成都小程序测试/成都机器人测试/成都游戏测试/成都物联网测试/选择指南 - 优质品牌商家
  • STM32G030F6 ADC多通道采样,用DMA搬运数据到底有多省心?一个CubeMx配置实例
  • 告别迷茫!S32K312 MCU的LIN通信实战:从EB Tresos配置到代码调试全流程避坑
  • Harness Engineering入门基础教程(非常详细),从人类写码到Agent开发,看这篇就够了!
  • Qt实战:用QCustomPlot打造高性能动态波形图(附GitHub源码)
  • 【MATLAB源码-第410期】基于matlab的图像去雾系统设计—采用暗通道先验、颜色衰减与导向滤波融合。
  • 【Swagger】Swagger系统性知识体系全方位结构化总结
  • [具身智能-234]:OpenCV - 图像通常是三维的(高 H × 宽 W × 通道 C,例如 RGB 三通道),而 Mask 通常是二维的(高 H × 宽 W,单通道黑白),为什么?
  • 大模型知识库教程(非常详细):搞懂Karpathy的Wiki,看这一篇就够了!
  • AI音景提升专注力的神经科学验证
  • 网安2512杨梓鑫 6052
  • 安卓开发者必看:解决Google Play服务报错的5种实战方法(附工具推荐)
  • 1949-2023年各地级市、县新注册农民专业合作社数量数据
  • 随笔4
  • [具身智能-237]:OpenCV - 图像的坐标轴
  • WPF MES 产线执行系统:AGV与立库协同控制的核心实现
  • EduCoder实训答案查询站是怎么建起来的?从签到、解锁到数据抓取的全流程复盘
  • firefox打开B站视频自动静音的处理方法
  • Comsol周期性超表面多极子分解仿真 (注意区分与单个散射体的区别,单个散射体多极子分解见主...
  • 小程序开发首选免费源码网:全开源生态下的创新加速器
  • 2000-2024年地级市、区县人口空心化数据
  • HarmonyOS6 半年磨一剑 - RcRadioGroup 组件与属性透传机制深度解析
  • BilibiliDown高效视频下载指南:全面掌握B站视频离线解决方案
  • 别再被rosdep卡住了!ALOHA机械臂部署中‘skip noetic’报错的保姆级解决方案
  • 游戏开发者必备免费源码网,一键搭建
  • HarmonyOS6 半年磨一剑 - RcSwitch 组件核心架构与类型系统设计
  • 2014~2025各省市区县分年、分月、逐日 PM10 面板数据
  • 硬件原理详解:500W无桥PFC开关电源设计资料与C语言源码实战解析
  • 分享稳定可靠的TMC5160、TMC5130高性能步进电机驱动代码,支持级联,简单易用,附送原理图
  • 保姆级教程:用Vivado MIG IP核搞定DDR3读写仿真(附AXI4波形分析)