当前位置：首页 > news >正文

（论文速读）基于信号-图像映射和深度Gabor卷积自适应池化网络的旋转机械智能故障诊断方法

news 2026/6/7 3:23:00

论文题目：A novel intelligent fault diagnosis method of rotating machinery based on signal-to-image mapping and deep Gabor convolutional adaptive pooling network（基于信号-图像映射和深度Gabor卷积自适应池化网络的旋转机械智能故障诊断方法）

会议：Expert Systems With Applications

摘要：针对振动信号灰度图像特征表示不足、易被强噪声淹没的局限性，卷积神经网络卷积核的随机生成和结构单一导致提取的特征不足，针对最大池化和平均池化导致模型过拟合和关键故障特征被抑制的问题，本文提出了一种基于信号-图像映射和深度Gabor卷积自适应池化网络的新型故障诊断方法。首先，设计了一种振动信号到图像的映射策略，以突出振动信号中的故障信息。然后提出用Gabor卷积滤波代替卷积核来指导模型提取多尺度、多方位的故障特征;其次，设计动态自适应池，以促进局部特征的保留和抑制关键特征的衰减。最后，构建了深度Gabor卷积自适应池化网络模型，提高了故障特征提取过程的鲁棒性和模型的泛化性。轴承和齿轮数据集的结果表明，该方法增强了特征提取能力，提高了模型的鲁棒性和泛化能力，实现了高精度的故障诊断。

深度Gabor卷积自适应池化网络：一种面向旋转机械的智能故障诊断新方法

一、研究背景与动机

旋转机械（如轴承、齿轮箱）是工业设备的核心部件，一旦发生故障，将带来巨大的经济损失和安全隐患。随着工业大数据时代的到来，基于深度学习的智能故障诊断方法成为研究热点。然而，现有方法普遍存在以下三类关键问题：

1.1 问题一：振动信号表达能力不足

振动信号通常以两种形式输入深度神经网络：

一维（1D）时域信号：在机械发生故障时呈现非平稳特性，难以直接反映机械健康状态，且极易被强噪声背景淹没；
二维（2D）图像：通常采用小波变换、短时傅里叶变换等信号处理手段进行转换，计算过程繁琐，且会导致图像尺度增大，影响后续模型训练。

【此处配图：Fig. 2振动信号成像（VSI）流程示意图】

1.2 问题二：卷积神经网络特征提取能力有限

传统CNN的卷积核通常由随机初始化生成，结构固定、形式单一，这导致：

提取的特征多样性不足；
对不同尺度、不同方向的故障特征捕捉能力有限；
最终影响故障诊断精度。

1.3 问题三：池化策略存在内在缺陷

最大池化（Max Pooling）：倾向于保留最显著的特征响应，但容易引发模型过拟合；
平均池化（Average Pooling）：对区域内所有激活值取平均，会抑制某些关键的激活值，导致关键故障特征衰减。

这三个问题共同制约着现有深度学习故障诊断方法的性能上限。为此，本文提出了一套系统性的解决方案。

二、方法提出：三大核心创新

本文提出的完整方法称为DGCAPN（Deep Gabor Convolutional Adaptive Pooling Network，深度Gabor卷积自适应池化网络），包含三项相互支撑的核心创新。

【此处配图：Fig. 6所提方法的完整故障诊断框架图】

2.1 创新一：振动信号成像（VSI）

核心思路：将1D原始振动信号编码为包含更丰富信息的RGB三通道2D彩色图像，而非简单的灰度图。

具体步骤如下：

Step 1：将1D振动信号按矩阵排列，变换为二维数据矩阵X（n×n）。

Step 2：对矩阵进行归一化，并映射到 [0, 255]

Step 3：将每个归一化后的值通过编码技术拆分为三个整数，分别对应RGB三个通道的像素值：

Step 4：将R、G、B三通道矩阵合并，生成最终的32大小的RGB图像。

优势：

无需复杂的信号处理（如小波变换），计算简洁；
保持图像尺度不变，避免数据膨胀；
通过三通道分别编码信号的整数部分、小数前两位、小数后两位，将信号中的精细差异放大，扩大不同健康状态之间的特征差异，有助于提升网络的辨识能力。

【此处配图：Fig. 21D振动信号到2D图像的映射过程】

2.2 创新二：Gabor卷积滤波器（GaCF）

核心思路：用基于Gabor函数生成的滤波器替代CNN中随机初始化的卷积核，引导网络提取多尺度、多方向的故障特征。

理论基础：2D Gabor函数是一种具有高斯窗的短时傅里叶函数，其实部（具有更强的滤波和特征提取能力）的表达式为：

其中，参数分别控制滤波器的波长、方向、相位偏移、高斯因子标准差和椭圆率，赋予了Gabor滤波器极强的方向与尺度适应性。

GaCF的学习机制：与随机卷积核的权重更新不同，GaCF通过梯度下降算法更新Gabor函数的5个物理参数，而非直接更新每个像素权重：

论文推导了对每个参数的偏导数解析式（见论文公式18-22），从而实现端到端的参数学习。

优势：

滤波器具有明确的物理意义（方向、频率等），特征多样性显著优于随机卷积核；
参数数量少，网络更加紧凑；
对噪声干扰的抵抗能力更强。

【此处配图：Fig. 3普通卷积核与Gabor卷积滤波器的生成过程对比图】

2.3 创新三：自适应动态池化（ADPooling）

核心思路：设计一种自适应机制，根据特征图的局部信息动态调整最大池化和平均池化的权重比例，既避免过拟合，又保留关键故障特征。

计算流程：

第一步，对特征图区域进行归一化

第二步，计算每个区域的池化调整因子$\alpha$（基于F范数）：

这实际上是，当特征值较大时（更多采用平均池化），当特征值较小时（更多采用最大池化）。

第三步，加权融合两种池化结果：

优势：

对显著激活区域倾向于平均池化，避免极端值引起的过拟合；
对弱激活区域倾向于最大池化，避免关键细微特征被平滑掉；
调整因子由网络自动计算，无需人工设定。

【此处配图：Fig. 4自适应动态池化的流程示意图】

2.4 DGCAPN 网络整体架构

将上述三项创新组合，构建 DGCAPN 模型，网络结构依次为：

输入层（32×32）→ GaCF 1（16个5×5滤波器）→ ADPooling 2（2×2）→ GaCF 3（32个3×3滤波器）→ ADPooling 4（2×2）→ GaCF 5（64个3×3滤波器）→ ADPooling 6（2×2）→ FC 7（256）→ FC 8（128）→ 输出层（Softmax）

【此处配图：Fig. 5DGCAPN模型结构图】

【此处配表：Table 1DGCAPN模型详细参数表】

训练超参数方面，使用Adam优化器，权重衰减1e-5，共训练100个epoch，批次大小200。

三、实验验证

3.1 实验设置

硬件平台：Intel Xeon Gold 6136 CPU + NVIDIA GRID P40-4Q GPU，内存24GB
框架：PyTorch（Python）
评估指标：Accuracy、Precision、Recall、F-score
重复次数：每个实验重复10次取平均，以排除偶然性

对比基线方法共11种：CNN、AlexNet、LeNet、ResNet、1D-CNN、DRSNs、SSAE-SVM、BiConvLSTM、CNN-gcForest、DAE、MLP。

3.2 案例一：轴承故障诊断（帕德博恩大学数据集）

数据集：来自帕德博恩大学轴承数据中心，共12种健康状态（1种正常 + 11种故障），采样频率64kHz，电机转速1500rpm，每个样本含1024个点，训练/测试样本数为2079/938。

【此处配图：Fig. 7帕德博恩大学实验台及轴承故障类型图片】

【此处配图：Fig. 812种健康状态的时域和频域信号图】

【此处配表：Table 4轴承数据集详细描述（PU数据集）】

主要结果：

【此处配表：Table 5不同诊断方法在12种健康状态下的平均测试精度对比】

所提方法在12种健康状态下的总体平均测试精度为96.16%，显著高于所有基线方法（如CNN 86.06%、AlexNet 92.82%、BiConvLSTM 93.86%、CNN-gcForest 93.50%）。

在鲁棒性方面：

【此处配表：Table 6不同方法在轴承诊断中的平均测试精度标准差】

所提方法的平均标准差仅为1.7152，远低于CNN（5.9513）、DRSNs（9.5295）等方法，说明模型鲁棒性更强。

综合性能指标方面：

【此处配表：Table 7不同诊断方法在轴承数据上的综合性能指标对比】

所提方法的Accuracy、Precision、Recall、F-score分别达到95.96%、96.04%、95.98%、95.95%，平均综合指标为95.98%，且对应标准差（0.4479、0.3984、0.4429、0.4481）均远低于所有基线方法。

【此处配图：Fig. 912种健康状态下各方法轴承诊断结果柱状图】

【此处配图：Fig. 1010次测试结果的雷达图（Accuracy/Precision/Recall/F-score）】

训练过程分析：

【此处配图：Fig. 11不同方法训练过程的Loss和Accuracy曲线对比】

从训练曲线可以看出，在epoch=5时所提方法的Loss即已显著低于CNN、AlexNet和LeNet，且Loss曲线更平滑、毛刺更少，说明模型在特征学习和鲁棒性上均具有优势。

混淆矩阵分析：

【此处配图：Fig. 12CNN、LeNet、AlexNet与所提方法的多分类混淆矩阵对比】

以KA16故障类型为例，CNN仅正确识别64个样本，而所提方法正确识别78个样本。

特征可视化（t-SNE）：

【此处配图：Fig. 13所提方法在轴承诊断中不同层特征的2D/3D聚类可视化】

在输入层，12种健康状态的特征分布严重重叠；经过网络学习后，在最后一层，不同健康状态的特征分布距离显著扩大，分类边界清晰可辨。

消融实验（控制变量）：

【此处配表：Table 8轴承数据集上各组成模块的性能对比（消融实验）】

【此处配图：Fig. 14轴承诊断消融实验的综合性能验证图】

结果表明：

VSI vs. GI（灰度图）：在相同模型和池化方式下，VSI处理的性能（如VSI-DGCAPN-ADP：95.96%）始终优于GI（GI-DGCAPN-ADP：94.80%）；
DGCAPN vs. CNN：在相同数据处理和池化方式下，DGCAPN性能始终高于CNN，验证了GaCF的有效性；
ADPooling vs. MaxPooling / AvgPooling：在相同数据和模型下，ADPooling的性能优于单独的最大池化和平均池化。

噪声鲁棒性实验：

【此处配表：Table 9不同SNR下各方法在轴承数据集上的性能指标（%）】

【此处配图：Fig. 15不同SNR下各方法的性能指标变化曲线（轴承数据集）】

在 $-4$ dB到10 dB的不同信噪比下，所提方法的Accuracy分别为58.85%、70.36%、76.23%、84.01%、88.27%、90.94%、92.26%、94.03%，均显著高于CNN、AlexNet和LeNet，且随SNR下降时性能曲线下滑趋势更为平缓，说明抗噪能力最强。

3.3 案例二：行星齿轮箱故障诊断（自建数据集）

数据集：来自实验室HD-FD-H-03P转子齿轮综合故障仿真试验台，共6种健康状态（1种正常 + 5种故障）。每种健康状态采集30秒振动信号，采样频率10204Hz，共1800个样本（每个含1024点），按7:3划分训练集（1260）和测试集（540）。

故障类型包括：行星齿轮裂纹（PGC）、行星齿轮断齿（PGBT）、行星齿轮点蚀（PGP）、太阳齿轮断齿（SGBT）、太阳齿轮点蚀（SGP）。

【此处配图：Fig. 16转子齿轮综合故障仿真试验台（HD-FD-H-03P）】

【此处配图：Fig. 17行星齿轮箱的各类齿轮故障实物图】

【此处配表：Table 10行星齿轮箱数据集详细描述】

主要结果：

【此处配表：Table 11不同方法在6种健康状态下的平均测试精度（齿轮数据）】

所提方法的总体平均测试精度为98.18%，显著高于所有基线（如CNN 91.91%、BiConvLSTM 95.27%、CNN-gcForest 95.06%）。在PGC、PGBT、PGP三类难以区分的故障上，所提方法的精度分别达到97.47%、97.46%、94.34%，均为所有方法中最高。

【此处配表：Table 12不同方法在齿轮诊断中的平均测试精度标准差】

所提方法的平均标准差仅为0.9455，远优于CNN（7.5046）、SSAE-SVM（6.8388）等，再次验证了更强的鲁棒性。

综合性能指标：

【此处配图：Fig. 20不同诊断方法在齿轮数据集上的性能指标对比（含数值表）】

所提方法的Accuracy、Precision、F-score分别达到98.17%、98.19%、98.16%，平均综合指标98.17%。

消融实验：

【此处配表：Table 13齿轮数据集上各组成模块的性能对比（消融实验）】

【此处配图：Fig. 24齿轮诊断消融实验的综合性能验证图】

结论与轴承数据集完全一致：VSI > GI，DGCAPN > CNN，ADPooling > MaxPooling/AvgPooling。三个模块各自独立地、且联合地提升了诊断性能。

噪声鲁棒性实验：

【此处配表：Table 14不同SNR下各方法在齿轮数据集上的性能指标（%）】

【此处配图：Fig. 25不同SNR下各方法的性能指标变化曲线（齿轮数据集）】

在 -4 dB到10 dB范围内，所提方法的Accuracy均高于对比方法，且性能下降趋势最为平缓。

四、结论与局限性

4.1 主要结论

本文提出的DGCAPN方法在轴承和齿轮两个数据集上均取得了优异成绩：

数据集	平均综合性能指标	平均标准差
轴承（12类）	95.98%	1.7152
齿轮（6类）	98.17%	0.9455

三项核心创新的贡献已通过消融实验逐一验证：

VSI：有效改善了原始时域灰度图表达不足的问题，突出了不同故障状态的特征差异；
GaCF：显著增强了特征的多样性和高质量表达能力，提升了抗噪性；
ADPooling：有效抑制了关键故障特征的衰减，兼顾了模型泛化性和对细节特征的保留。

4.2 局限性与未来工作

作者坦诚地指出，该方法仍存在以下不足：

大数据集扩展性：随数据集规模增大，DGCAPN在特征提取时的运行时间呈非线性增长；
小样本场景：当训练样本数量较少时，模型性能会显著下降。

未来研究方向：结合迁移学习以提升小样本场景下的诊断能力。

五、方法总结

DGCAPN方法的完整流程可概括为四步：

振动信号采集 ↓ VSI（振动信号成像）：1D → RGB 2D图像（32×32×3） ↓ DGCAPN网络（GaCF + ADPooling）：多尺度特征提取与自适应池化 ↓ Softmax分类输出：故障类型识别

本文的核心贡献在于将信号处理（VSI）、滤波器设计（GaCF）和池化策略（ADPooling）三个维度的改进有机融合，形成一套针对旋转机械故障诊断的完整深度学习解决方案，为该领域提供了新的研究思路与实践参考。

查看全文

http://www.jsqmd.com/news/609905/

Java学习笔记_Day22

AKConv卷积模块深度评测：在YOLOv8n/s/m/l/x全系列模型上的涨点效果与推理速度实测

5分钟上手libhv：用自带httpd和curl工具快速搭建本地测试服务

锅炉智能控制系统：西门子PLC与昆仑触摸屏协同工作，CAD电气图纸指导下的技术实现

【UE5】数字人实战：从动捕到物理发型的全链路搭建

MyString类的常见面试问题

破解GitHub访问难题：Fast-GitHub 3大核心引擎实现开源项目访问加速

Claude Code fileHistory 文件编辑快照与回滚机制深度解析

Python 数据处理封神篇：CSV+JSON 全解析，从入门到天气 API 实战

别再只用threshold了！Halcon二值化8大算子保姆级对比（附实战避坑指南）

六种AI驱动的文献引用生成策略在学术研究中的高效应用

【信息科学与工程学】【管理科学】第十六篇利益设计与分配：从静态薪酬到动态激励生态系统的工程化重构

面向法律文书 Agent 的 Harness 条款冲突检测

HJ168 小红的字符串

Kali+PHPStudy搭建红日靶场：那些教程里没提的玄学问题解决方案

状态对写题很重要

React倒计时终极方案：时间对齐+面试必考

【RWA 机制，ERC-4626，ERC-3643，ERC-7540，ERC-7575，LayerZero】

2026降AI率工具实测：SpeedAI科研小助手为什么是首选？

小红书合规引流新姿势：聚光平台落地页卡片制作全流程指南

40岁程序员未裸辞！AI赋能后，我的月薪从6k涨到6.07万，行业真相曝光！

阿姆智创15.6寸工控电脑一体机，源头工厂ODM定制方案，赋能工业产线与机器视觉设备场景

编译即优化：Cuvil在Llama-3-8B本地推理中的延迟压降至127ms，你还在用原生torch.compile？

Python数据分析如何重置索引_Pandas的reset_index应用

计算机毕业设计：Python全国空气质量与气象监测平台 Flask框架可视化数据分析机器学习天气深度学习 AI 空气质量分析（建议收藏）✅

深入解析MCU：从哈佛架构到智能家居应用

深度可分离卷积

CC2530开发入门：用IAR EW8051和SmartRF Flash Programmer烧录第一个Zigbee程序

为什么你的API吞吐量卡在8k QPS？Span＜T＞ + MemoryPool＜T＞组合拳让Kestrel直冲23k QPS（附压测报告）

头歌实战 3-3 MongoDB 复杂条件查询与数据聚合技巧