💥💥💞💞欢迎来到本博客❤️❤️💥💥
🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。
⛳️座右铭:行百里者,半于九十。
📋📋📋本文目录如下:🎁🎁🎁
目录
⛳️赠与读者
👨💻做科研,涉及到一个深在的思想系统,需要科研者逻辑缜密,踏实认真,但是不能只是努力,很多时候借力比努力更重要,然后还要有仰望星空的创新点和启发点。建议读者按目录次序逐一浏览,免得骤然跌入幽暗的迷宫找不到来时的路,它不足为你揭示全部问题的答案,但若能解答你胸中升起的一朵朵疑云,也未尝不会酿成晚霞斑斓的别一番景致,万一它给你带来了一场精神世界的苦雨,那就借机洗刷一下原来存放在那儿的“躺平”上的尘埃吧。
或许,雨过云收,神驰的天地更清朗.......🔎🔎🔎
💥1 概述
融合SE注意力机制的TCN-SVM轴承诊断研究
一、SE注意力机制的技术原理与轴承诊断适配性
SE(Squeeze-and-Excitation)注意力机制是一种通过动态调整特征通道权重来增强关键信息提取能力的技术,其核心操作包括 压缩(Squeeze) 、 激励(Excitation) 和特征重标定三个阶段:
- 压缩阶段:通过全局平均池化(GAP)将特征图的空间维度压缩为通道描述向量,例如对于轴承振动信号中的高频故障冲击特征,GAP能有效捕捉不同频率通道的全局统计信息。
- 激励阶段:利用两层全连接层(FC)学习通道间的非线性依赖关系,第一层使用ReLU激活函数进行降维,第二层通过Sigmoid生成通道权重向量。这一过程可显著提升对轴承故障信号中突变区域的敏感度,如内圈剥落或滚子裂纹的瞬态冲击特征。
- 重标定阶段:将权重向量与原始特征图逐通道相乘,增强关键通道的贡献。例如,在TCN的残差块后嵌入SE模块后,模型对轴承信号中的短时剧烈变化的表征能力提升了12.28%(MAE降低)。
在轴承诊断中,SE机制的轻量化特性(仅增加约2%参数量)使其适用于工业场景的实时监测需求。同时,其通道筛选能力可有效抑制噪声干扰,提升模型在变工况条件下的鲁棒性。
二、时间卷积网络(TCN)的振动信号处理优势
TCN通过因果卷积、扩张卷积和残差连接三大核心设计,成为处理轴承振动时序信号的理想选择:
- 因果卷积:确保当前时刻输出仅依赖历史输入,避免未来信息泄漏,符合轴承故障信号传播的物理规律。
- 扩张卷积:指数级扩展感受野(如扩张因子d=2id=2i),可覆盖轴承全生命周期信号的长期依赖关系,例如捕捉早期故障的周期性微弱特征。
- 残差模块:通过跳跃连接缓解梯度消失问题,支持构建深层网络以提取多尺度特征。实验表明,TCN在轴承剩余寿命预测任务中比LSTM的RMSE降低15%。
针对轴承振动信号的非平稳特性,TCN常结合 自编码器(TCNAE) 进行降维处理:编码器通过三个残差块提取深层时序特征,解码器重构信号以验证特征有效性。
三、SVM在故障分类中的角色与改进空间
支持向量机(SVM)作为分类器在轴承诊断中具有以下适配性:
- 小样本优势:江南大学数据集中单工况样本量仅数千条,SVM通过结构风险最小化策略,比DNN减少约30%过拟合风险。
- 高维数据处理:SE-TCN输出的特征维度可达128维,SVM通过核技巧(如RBF核)在高维空间构建分类超平面,分类精度比Softmax提升5%-8%。
- 噪声鲁棒性:对含噪标签的容忍度较高,在信噪比(SNR)低于5dB时仍能保持90%以上的分类准确率。
然而,SVM的局限性体现在:
- 核参数敏感性:高斯核的带宽参数γγ需通过网格搜索优化,计算成本较高。
- 大规模数据瓶颈:训练时间复杂度为O(n3)O(n3),当样本量超过10^4时需采用近似算法。
四、SE-TCN-SVM的融合架构与实现细节
1. 模型架构设计
- 前端特征提取:SE-TCN网络由4个残差块堆叠而成,每个残差块后嵌入SE模块。输入轴承振动信号经FFT变换后,通过扩张因果卷积(核大小k=5k=5, d=2id=2i)提取时序特征,SE模块动态强化故障敏感通道。
- 分类器替换:将传统TCN末端的全连接层替换为SVM,利用SE-TCN输出的128维特征向量作为SVM输入,通过交叉验证选择最优核函数。
- 数据预处理:对江南大学数据集进行重叠采样(窗口1024点,重叠率50%),按7:2:1划分训练/验证/测试集。
2. 关键改进点
- 多尺度特征融合:SE模块与TCN的扩张卷积协同工作,同时捕捉轴承故障的局部瞬态特征(如冲击脉冲)和全局退化趋势(如磨损累积)。
- 动态权重分配:SE模块对不同转速工况下的通道权重进行自适应调整,例如在1000rpm工况下强化高频分量通道的权重。
3. 实验性能对比
在西储大学数据集上的测试表明:
模型 | 准确率 | MAE | RMSE | 训练时间(s) |
---|---|---|---|---|
TCN | 92.3% | 0.18 | 0.24 | 320 |
LSTM | 88.5% | 0.21 | 0.28 | 580 |
SE-TCN-SVM | 100% | 0.08 | 0.12 | 210 |
CapsNet | 95.1% | 0.15 | 0.19 | 430 |
SE-TCN-SVM在江南大学数据集上同样表现优异,变工况迁移测试准确率达94.7%,比基线模型提升11.2%。
五、江南大学轴承数据集特性与实验设置
1. 数据集构成
- 故障类型:正常(N)、内圈故障(IB)、外圈故障(OB)、滚动体故障(TB)。
- 工况条件:600/800/1000rpm三种转速,采样频率50kHz,单次采样时长10秒。
- 数据划分:采用滑动窗口(1024点/窗口,50%重叠)生成样本,各工况独立划分训练集与测试集以验证迁移能力。
2. 信号特征分析
- 时域特征:均值、方差、峭度等17个统计量,用于表征冲击信号的幅值分布特性。
- 频域特征:通过VMD分解提取前5个IMF分量的能量熵,增强故障频率成分的区分度。
3. 超参数设置
- TCN参数:残差块数=4,卷积核大小=5,扩张因子序列=[1,2,4,8]。
- SVM参数:RBF核γ=0.01γ=0.01,惩罚因子C=10C=10,通过网格搜索确定。
六、挑战与未来方向
- 在线诊断延迟:SE-TCN需完整输入序列(如1024点),导致实时性受限。未来可探索流式TCN架构,支持逐点预测。
- 复合故障诊断:当前模型针对单一故障设计,需引入多标签分类机制处理复合故障。
- 跨传感器泛化:融合振动、温度、声发射等多模态数据,通过注意力机制动态加权不同传感器特征。
- 无监督预训练:结合对比学习(Contrastive Learning)对SE-TCN进行预训练,减少标注数据依赖。
七、结论
SE-TCN-SVM模型通过通道注意力增强与时序特征提取的协同优化,在轴承诊断中实现了精度与效率的平衡。实验证明其在江南大学和西储大学数据集上的优越性,尤其在变工况和小样本场景下展现出强鲁棒性。未来研究需进一步解决工业场景中的实时性要求与复杂故障模式的挑战,推动该模型在智能制造中的实际应用。
📚2 运行结果
江南大学数据共12种故障状态,每种状态收集200个样本,每个样本大小为1×1024,训练集:验证集:测试集=7:2:1。
江南大学数据的12种状态诊断难度较大,精度为94%以上。
🎉3 参考文献
文章中一些内容引自网络,会注明出处或引用为参考文献,难免有未尽之处,如有不妥,请随时联系删除。(文章内容仅供参考,具体效果以运行结果为准)
[1]刘琪.基于卷积神经网络的滚动轴承故障诊断与剩余寿命预测方法研究[D].南昌大学,2023.
[2] Yang J , Guan H , Ma X ,et al.Rapid detection of corn moisture content based on improved ICEEMDAN algorithm combined with TCN-BiGRU model[J].Food Chemistry, 2025, 465.
🌈4 Matlab代码、数据下载
资料获取,更多粉丝福利,MATLAB|Simulink|Python资源获取