高速列车轴承智能故障诊断问题解决思路
一、问题背景
高速列车轴承作为走行系统的关键旋转部件,长期处于高转速、交变载荷工况,故障率高且故障后果严重(如列车延误、脱轨)。当前诊断方法存在三大瓶颈:
- 数据质量问题:实际运营列车(目标域)故障数据极度稀缺(仅16个无标签样本),台架试验数据(源域)虽丰富(161个样本,含正常N、内圈故障IR、外圈故障OR、滚动体故障B,多故障尺寸、载荷、采样频率),但受轻微噪声干扰,故障特征显著性弱;
- 域分布差异:源域(SKF6205/6203轴承,12/48KHz采样,0-3马力载荷,转速随RPM变化)与目标域(列车轴承,32KHz采样,90km/h对应转速≈600rpm,实际载荷)的工况、设备参数差异大,导致直接使用源域模型诊断目标域误差高;
- 模型可解释性差:深度学习模型“黑箱”特性导致迁移诊断过程难以理解,影响工程应用信任度。
迁移学习技术为跨域诊断提供解决方案:通过源域数据学习故障知识,迁移至目标域以缓解样本不平衡;结合轴承故障机理(如故障特征频率BPFO/BPFI/BSF)的特征提取,可进一步提升诊断精度。
二、需要解决的问题
围绕题目4项任务,核心待解决问题如下:
1. 源域数据筛选与故障特征提取
- 如何结合目标域迁移需求筛选源域数据?源域数据包含多载荷(0-3马力)、多故障尺寸(0.007-0.028英寸)、多采样频率(12/48KHz),需优先筛选与目标域工况(有载、转速≈600rpm)更相似的样本,排除无关数据(如0载荷、转速差异过大样本);
- 如何选择适配故障机理的特征提取方法?需从时域(反映冲击特性)、频域(反映故障特征频率)、时频域(反映非平稳信号时变特性)中选择方法,同时处理源域轻微噪声,确保提取的特征能迁移至目标域。
2. 源域故障诊断模型设计与评价
- 如何平衡源域数据类别分布?源域正常样本仅4个,远少于故障样本(OR77个、IR40个、B40个),需解决训练集类别不平衡问题;
- 如何设计高效诊断模型并评价?需选择能自动学习复杂特征的模型(如深度学习),并通过多指标(准确率、召回率、F1、混淆矩阵)验证模型泛化能力,为后续迁移奠定基础。
3. 目标域迁移诊断与标签标定
- 如何缩小源域与目标域的分布差异?需选择适配无标签目标域的迁移学习方法(如无监督域自适应),通过度量域差异(如MMD、KL散度)验证迁移效果;
- 如何可视化迁移结果并标定目标域标签?需通过特征降维(如TSNE)展示迁移后域特征的重叠度,结合故障机理验证(如频谱中故障特征频率的存在性),为16个目标域样本分配可靠标签。
4. 迁移诊断的可解释性分析
- 如何从迁移过程或决策结果反推模型逻辑?需选择事前(模型结构透明性)、过程(知识迁移路径)、事后(决策依据反推)中的至少一个维度,结合轴承故障机理(如故障冲击信号的时域特征、故障频率的频域特征),证明模型决策的合理性。
三、问题建模
将各任务转化为可量化、可执行的模型,核心建模如下:
1. 源域数据筛选模型
定义源域-目标域相似度指标,筛选与目标域工况匹配的源域子集DS′D_S'DS′:
- 转速相似度:目标域轴承转频fr,target=600/60=10 Hzf_{r,\text{target}}=600/60=10\ \text{Hz}fr,target=600/60=10 Hz,源域转频fr,source=RPM/60f_{r,\text{source}}=\text{RPM}/60fr,source=RPM/60,筛选∣fr,source−fr,target∣<ε|f_{r,\text{source}} - f_{r,\text{target}}| < \varepsilon∣fr,source−fr,target∣<ε(ε=1 Hz\varepsilon=1\ \text{Hz}ε=1 Hz,允许小范围误差);
- 载荷适配性:目标域为实际列车(有载),排除源域0载荷样本,保留1/2/3马力样本;
- 传感器位置优先级:源域DE(驱动端)、FE(风扇端)信号故障特征显著,BA(基座)信号衰减严重,优先选择DE/FE信号构建DS′D_S'DS′。
2. 故障特征提取模型
(1)时域特征(反映冲击脉冲特性)
对信号x(t)x(t)x(t)(长度为NNN)提取5个统计特征:
- 均值:μ=1N∑i=1Nxi\mu = \frac{1}{N}\sum_{i=1}^N x_iμ=N1∑i=1Nxi(反映信号整体水平);
- 峭度:K=1N∑i=1N(xi−μ)4σ4K = \frac{1}{N}\sum_{i=1}^N \frac{(x_i - \mu)^4}{\sigma^4}K=N1∑i=1Nσ4(xi−μ)4(故障信号冲击性强,峭度值高于正常信号);
- 峰峰值:Xpp=max(xi)−min(xi)X_{\text{pp}} = \max(x_i) - \min(x_i)Xpp=max(xi)−min(xi)(反映信号波动幅度);
- 方差σ2\sigma^2σ2、偏度SSS(辅助区分故障类型)。
(2)频域特征(反映故障特征频率)
- 对x(t)x(t)x(t)做FFT得到频率谱X(f)X(f)X(f),计算功率谱密度PSD(f)\text{PSD}(f)PSD(f);
- 根据源域轴承参数(表1)计算故障特征频率:
- 外圈故障频率BPFO=fr⋅Nd2⋅(1−dD)\text{BPFO} = f_r \cdot \frac{N_d}{2} \cdot (1 - \frac{d}{D})BPFO=fr⋅2Nd⋅(1−Dd);
- 内圈故障频率BPFI=fr⋅Nd2⋅(1+dD)\text{BPFI} = f_r \cdot \frac{N_d}{2} \cdot (1 + \frac{d}{D})BPFI=fr⋅2Nd⋅(1+Dd);
- 滚动体故障频率BSF=fr⋅Dd⋅[1−(dD)2]\text{BSF} = f_r \cdot \frac{D}{d} \cdot [1 - (\frac{d}{D})^2]BSF=fr⋅dD⋅[1−(Dd)2];
- 提取PSD(f)\text{PSD}(f)PSD(f)在BPFO/BPFI/BSF±Δf\text{BPFO/BPFI/BSF} \pm \Delta fBPFO/BPFI/BSF±Δf(Δf=50 Hz\Delta f=50\ \text{Hz}Δf=50 Hz)范围内的最大值、均值作为频域特征。
(3)时频域特征(反映非平稳信号)
采用短时傅里叶变换(STFT) 将x(t)x(t)x(t)转化为二维时频图T(f,t)T(f,t)T(f,t):
- 窗口长度:256(平衡时间/频率分辨率,确保故障特征频率可识别);
- 归一化:将T(f,t)T(f,t)T(f,t)缩放到[0,1][0,1][0,1],作为深度学习模型的图像输入(保留时频联合信息)。
3. 源域诊断模型
采用“特征提取器+分类器”的CNN模型结构:
- 输入:STFT时频图(尺寸256×256×1256 \times 256 \times 1256×256×1);
- 特征提取器:3组“3×33 \times 33×3卷积(ReLU激活)+2×22 \times 22×2最大池化”(提取局部时频特征);
- 分类器:2层全连接层+Softmax输出(4个类别:N/IR/OR/B);
- 损失函数:交叉熵损失(处理多分类),结合SMOTE过采样(解决正常样本少的类别不平衡问题)。
4. 迁移学习模型(DANN)
针对目标域无标签特性,采用无监督域自适应模型DANN(Domain-Adversarial Neural Network) :
- 结构:共享特征提取器(复用源域CNN的特征提取器)+ 任务分类器(源域故障分类)+ 域分类器(区分源/目标域);
- 损失函数:总损失Ltotal=Ltask+λ⋅LdomainL_{\text{total}} = L_{\text{task}} + \lambda \cdot L_{\text{domain}}Ltotal=Ltask+λ⋅Ldomain,其中:
- LtaskL_{\text{task}}Ltask:源域分类交叉熵损失(最小化源域误差);
- LdomainL_{\text{domain}}Ldomain:域分类交叉熵损失(最大化域识别误差,迫使共享特征“域不变”);
- λ\lambdaλ:平衡系数(通过验证集调优,取0.1-1.0);
- 域差异度量:用最大均值差异(MMD) 量化源/目标域共享特征的分布差异,MMD(X,Y)=∥1m∑x∈Xϕ(x)−1n∑y∈Yϕ(y)∥2MMD(X,Y) = \|\frac{1}{m}\sum_{x \in X}\phi(x) - \frac{1}{n}\sum_{y \in Y}\phi(y)\|^2MMD(X,Y)=∥m1∑x∈Xϕ(x)−n1∑y∈Yϕ(y)∥2(ϕ\phiϕ为特征映射,MMD越小,域差异越小)。
5. 可解释性模型
选择“迁移过程可解释性+事后可解释性”结合:
- 过程解释:跟踪DANN训练中MMD值的变化(域差异缩小→迁移有效),可视化共享特征的TSNE降维结果(源/目标域特征重叠度提升→知识迁移成功);
- 事后解释:用SHAP(SHapley Additive exPlanations) 计算目标域样本各特征维度的贡献度,验证贡献度最高的维度是否对应故障特征频率(符合故障机理)。
四、求解方法框架
按题目4项任务分步骤实施,确保每步可复现、结果可验证:
任务1:数据分析与故障特征提取
步骤1:源域数据预处理
- 数据加载:用Python(scipy.io)读取.mat文件,提取DE/FE信号、RPM、time变量;
- 去噪处理:采用小波阈值去噪(选择db4小波,软阈值,消除源域轻微噪声);
- 信号截断:目标域采集时间8秒,源域信号截取1秒片段(避免冗余,保证特征一致性),若信号长度不足1秒,补零至1秒。
步骤2:源域数据筛选
根据“源域-目标域相似度指标”筛选,输出筛选后子集DS′D_S'DS′:
- 转速筛选:计算fr,source=RPM/60f_{r,\text{source}}=\text{RPM}/60fr,source=RPM/60,保留9 Hz≤fr,source≤11 Hz9\ \text{Hz} \leq f_{r,\text{source}} \leq 11\ \text{Hz}9 Hz≤fr,source≤11 Hz的样本;
- 载荷筛选:保留载荷为1/2/3马力的样本(排除0载荷);
- 故障尺寸筛选:保留故障尺寸0.014-0.028英寸(排除过小尺寸0.007英寸,更接近实际列车故障)。
步骤3:多维度特征提取
- 时域特征:计算每个信号片段的μ、σ2、Xpp、K、S\mu、\sigma^2、X_{\text{pp}}、K、Sμ、σ2、Xpp、K、S,组成5维时域特征向量;
- 频域特征:对去噪后信号做FFT,计算PSD\text{PSD}PSD,提取故障特征频率附近的最大值、均值,组成6维频域特征向量(BPFO、BPFI、BSF各2个特征);
- 时频域特征:对去噪后信号做STFT(窗口长度256,重叠率50%),生成256×256256 \times 256256×256时频图,归一化后作为CNN输入特征。
步骤4:特征融合(可选)
若采用传统机器学习(如SVM),将时域+频域特征向量拼接为11维特征向量;若采用深度学习,直接使用时频图作为输入(无需拼接)。
任务2:源域故障诊断
步骤1:数据集划分与平衡
- 划分比例:DS′D_S'DS′按8:2划分为训练集(80%)、测试集(20%),采用分层抽样(保证各故障类别比例不变);
- 类别平衡:对训练集中的正常样本(N)采用SMOTE过采样,生成合成样本,使训练集中各类别样本数≥30个(避免模型偏向多数类)。
步骤2:CNN诊断模型训练
- 模型搭建:用TensorFlow/Keras搭建CNN,参数设置:
- 卷积层:32→64→128个卷积核(3×3),ReLU激活;
- 池化层:2×2最大池化,步长2;
- 全连接层:512→256个神经元,Dropout(0.5)防止过拟合;
- 输出层:4个神经元,Softmax激活;
- 训练参数:Adam优化器(学习率0.001),batch size=32, epochs=80,早停(patience=10)防止过拟合。
步骤3:模型评价
在测试集上计算以下指标,绘制混淆矩阵:
- 宏观指标:准确率(Accuracy)、宏观召回率(Macro-Recall)、宏观F1(Macro-F1);
- 类别指标:各类别(N/IR/OR/B)的精确率、召回率(重点关注正常样本的召回率,避免漏诊);
- 验收标准:测试集准确率≥95%,否则调整模型结构(如加入残差块)或优化特征提取。
任务3:迁移诊断
步骤1:目标域数据预处理
- 数据加载:读取16个目标域样本(A-P),提取振动信号;
- 统一采样频率:目标域采样频率32KHz,源域筛选后为12/48KHz,将目标域信号重采样至24KHz(折中值,减少频率差异);
- 特征提取:与源域一致,生成目标域样本的时频图(输入DANN模型)。
步骤2:DANN迁移模型训练
- 模型初始化:共享特征提取器加载任务2中训练好的CNN权重(冻结前2层卷积,只训练后1层卷积,保留源域知识);
- 对抗训练:
- 阶段1:固定共享特征提取器,训练任务分类器(源域分类)和域分类器(源/目标域区分),各训练10轮;
- 阶段2:联合训练三部分,最小化LtotalL_{\text{total}}Ltotal,每轮计算源/目标域特征的MMD值,直至MMD值稳定(变化<0.01);
- 超参调优:通过验证集(源域训练集的10%)调整λ\lambdaλ,选择MMD最小、源域分类准确率最高的λ\lambdaλ(通常λ=0.5\lambda=0.5λ=0.5)。
步骤3:目标域分类与标签标定
- 分类预测:将目标域16个样本输入训练好的DANN,任务分类器输出类别概率,取概率最大的类别作为标签;
- 机理验证:对每个预测样本,绘制其频域频谱,检查是否存在对应类别的故障特征频率(如预测OR则检查BPFO),若存在则标签可靠,否则重新预测;
- 结果输出:整理16个样本(A-P)的标签,格式为“样本编号-预测类别-概率-验证结果”。
步骤4:结果可视化
- 特征降维可视化:用TSNE将源域训练集、源域测试集、目标域样本的共享特征降维至2D,绘制散点图(颜色区分类别),展示迁移后目标域样本与源域类别的聚类情况;
- 混淆矩阵:绘制目标域分类结果的混淆矩阵(虽无真实标签,但可展示模型对各类别的预测分布);
- 信号对比图:选取预测为IR、OR、B、N的典型样本,绘制其时域波形和频域频谱,标注预测类别及对应故障特征频率。
任务4:迁移诊断的可解释性分析
步骤1:迁移过程可解释性
- MMD变化曲线:绘制DANN训练过程中MMD值随轮次的变化,若曲线呈下降趋势并稳定,说明域分布差异缩小,知识有效迁移;
- 卷积核激活可视化:对共享特征提取器的最后一层卷积核,绘制其对目标域典型样本的激活热力图,观察激活区域是否覆盖故障特征频率对应的频段(如OR样本激活BPFO频段)。
步骤2:事后可解释性
- SHAP值分析:用SHAP库计算目标域每个样本的SHAP值,绘制SHAP summary plot,展示各特征维度(时频图的频率-时间点)对预测结果的贡献度;
- 案例验证:选取预测为“IR”的样本(如样本C),绘制SHAP依赖图,展示贡献度最高的特征维度(如100-150Hz频段,对应IR的BPFI频率)与预测概率的关系,验证该频段信号增强时,IR预测概率显著提升,符合内圈故障机理;
- 结论输出:总结模型决策的关键特征与故障机理的一致性,证明模型决策并非随机,而是基于故障相关特征。
关键注意事项
- 数据一致性:源域与目标域的特征提取方法必须完全一致(如时频图尺寸、去噪方法),否则域差异会增大;
- 模型鲁棒性:若任务2的CNN准确率低于95%,需先优化源域模型(如增加残差块、调整过采样比例),再进行迁移;
- 标签可靠性:目标域标签需结合故障机理验证(频谱分析),避免仅依赖模型概率,提高工程可信度。

4351

被折叠的 条评论
为什么被折叠?



