当前位置：首页 > news >正文

基于改进DETR的齿轮表面缺陷检测系统设计与实现

news 2026/7/4 14:09:15

1. 项目背景与核心价值

齿轮作为工业传动系统的核心部件，其表面质量直接影响设备寿命和运行安全。传统人工检测方式存在效率低、漏检率高的问题，而基于深度学习的视觉检测技术正逐步成为工业质检的新标准。我们团队基于改进DETR算法开发的齿轮表面缺陷识别系统，在保持实时性的同时将检测精度提升至82.4%，较传统方法提升近30个百分点。

这套系统包含三个创新点：首先采用重参数化卷积改进的特征提取网络，在NEU-DET数据集上测试显示，对微小划痕（<0.5mm）的识别率提升17.6%；其次设计的多尺度特征金字塔结构，使跨尺寸齿轮的检测稳定性提升至89.7%；最后引入的注意力机制改进方案，在强反光场景下的误报率降低至3.2%。整套方案已部署在某变速箱制造企业的产线，实现每分钟60件的高速检测。

2. 技术架构解析

2.1 改进DETR算法设计

传统DETR算法在工业检测中存在两个痛点：一是计算复杂度高导致推理速度慢，二是对小目标检测效果欠佳。我们的改进方案包含以下关键技术点：

骨干网络优化：

采用FasterNet-Tiny作为基础架构，其PConv层经过重参数化改进
在保持83.6%原精度前提下，参数量减少42%（从18.7M降至10.8M）
实测推理速度提升至112FPS（RTX3060显卡）

多尺度特征融合：

class DMSFPN(nn.Module): def __init__(self, in_channels=[64,128,256]): super().__init__() self.mscb = MSCB(in_channels) # 多尺度卷积块 self.eucb = EUCB(scale_factor=2) # 高效上采样模块 def forward(self, features): # 特征图尺寸示例：[bs,64,160,160]、[bs,128,80,80]、[bs,256,40,40] fused = [] for i in range(len(features)): x = self.mscb(features[i]) if i > 0: x = self.eucb(x) + features[i] fused.append(x) return torch.cat(fused, dim=1)

注意力机制改进：

将原始Transformer中的自注意力替换为TSSA模块
内存占用降低63%（从4.2GB降至1.5GB）
在强噪声环境下的mAP保持率提升至91.3%

2.2 数据集构建与增强

我们收集了包含6类常见缺陷的齿轮数据集：

总样本量：12,847张（训练集9,592张，测试集3,255张）
缺陷类型：划痕（32%）、凹坑（24%）、锈蚀（18%）、缺损（12%）、毛刺（9%）、其他（5%）

数据增强策略：

transform = A.Compose([ A.RandomGamma(gamma_limit=(80,120), p=0.5), A.GaussNoise(var_limit=(10,50), p=0.3), A.RandomShadow(num_shadows=2, p=0.2), A.CoarseDropout(max_holes=8, p=0.4), A.RandomBrightnessContrast(p=0.5), ], bbox_params=A.BboxParams(format='pascal_voc'))

3. 系统实现细节

3.1 训练配置

硬件环境：

GPU：NVIDIA RTX 3090×2
内存：128GB DDR4
存储：2TB NVMe SSD

超参数设置：

training: batch_size: 32 epochs: 150 optimizer: AdamW lr: 1e-4 weight_decay: 1e-4 lr_scheduler: CosineAnnealingLR warmup_epochs: 10 model: backbone: FasterNet-Tiny neck: DMSFPN head: TSSA-DETR num_queries: 100

关键训练技巧：

采用渐进式分辨率训练（160→320→640）
引入课程学习策略，先训练简单样本
使用EMA（指数移动平均）模型保存

3.2 部署方案

工业现场部署采用TensorRT加速：

模型转换流程：

trtexec --onnx=model.onnx \ --saveEngine=model.engine \ --fp16 \ --workspace=4096 \ --builderOptimizationLevel=3

性能对比： | 方案 | 推理时延(ms) | 显存占用(MB) | 吞吐量(FPS) | |------|-------------|-------------|------------| | 原始PyTorch | 28.6 | 2834 | 34.9 | | TensorRT-FP32 | 15.2 | 1872 | 65.8 | | TensorRT-FP16 | 9.7 | 1265 | 103.1 |