2025华为杯研究生数学建模竞赛E题及求解思路

原创已于 2025-09-21 09:29:26 修改 · 3.3k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#数学建模

于 2025-09-21 09:22:42 首次发布

科研同时被 2 个专栏收录

29 篇文章

订阅专栏

数学建模

13 篇文章

订阅专栏

高速列车轴承智能故障诊断问题解决思路

一、问题背景

高速列车轴承作为走行系统的关键旋转部件，长期处于高转速、交变载荷工况，故障率高且故障后果严重（如列车延误、脱轨）。当前诊断方法存在三大瓶颈：

数据质量问题：实际运营列车（目标域）故障数据极度稀缺（仅16个无标签样本），台架试验数据（源域）虽丰富（161个样本，含正常N、内圈故障IR、外圈故障OR、滚动体故障B，多故障尺寸、载荷、采样频率），但受轻微噪声干扰，故障特征显著性弱；
域分布差异：源域（SKF6205/6203轴承，12/48KHz采样，0-3马力载荷，转速随RPM变化）与目标域（列车轴承，32KHz采样，90km/h对应转速≈600rpm，实际载荷）的工况、设备参数差异大，导致直接使用源域模型诊断目标域误差高；
模型可解释性差：深度学习模型“黑箱”特性导致迁移诊断过程难以理解，影响工程应用信任度。

迁移学习技术为跨域诊断提供解决方案：通过源域数据学习故障知识，迁移至目标域以缓解样本不平衡；结合轴承故障机理（如故障特征频率BPFO/BPFI/BSF）的特征提取，可进一步提升诊断精度。

二、需要解决的问题

围绕题目4项任务，核心待解决问题如下：

1. 源域数据筛选与故障特征提取

如何结合目标域迁移需求筛选源域数据？源域数据包含多载荷（0-3马力）、多故障尺寸（0.007-0.028英寸）、多采样频率（12/48KHz），需优先筛选与目标域工况（有载、转速≈600rpm）更相似的样本，排除无关数据（如0载荷、转速差异过大样本）；
如何选择适配故障机理的特征提取方法？需从时域（反映冲击特性）、频域（反映故障特征频率）、时频域（反映非平稳信号时变特性）中选择方法，同时处理源域轻微噪声，确保提取的特征能迁移至目标域。

2. 源域故障诊断模型设计与评价

如何平衡源域数据类别分布？源域正常样本仅4个，远少于故障样本（OR77个、IR40个、B40个），需解决训练集类别不平衡问题；
如何设计高效诊断模型并评价？需选择能自动学习复杂特征的模型（如深度学习），并通过多指标（准确率、召回率、F1、混淆矩阵）验证模型泛化能力，为后续迁移奠定基础。

3. 目标域迁移诊断与标签标定

如何缩小源域与目标域的分布差异？需选择适配无标签目标域的迁移学习方法（如无监督域自适应），通过度量域差异（如MMD、KL散度）验证迁移效果；
如何可视化迁移结果并标定目标域标签？需通过特征降维（如TSNE）展示迁移后域特征的重叠度，结合故障机理验证（如频谱中故障特征频率的存在性），为16个目标域样本分配可靠标签。

4. 迁移诊断的可解释性分析

如何从迁移过程或决策结果反推模型逻辑？需选择事前（模型结构透明性）、过程（知识迁移路径）、事后（决策依据反推）中的至少一个维度，结合轴承故障机理（如故障冲击信号的时域特征、故障频率的频域特征），证明模型决策的合理性。

三、问题建模

将各任务转化为可量化、可执行的模型，核心建模如下：

1. 源域数据筛选模型

定义源域-目标域相似度指标，筛选与目标域工况匹配的源域子集 $D_S'$ ：

转速相似度：目标域轴承转频 $Hzf_{r,\text{target}}=600/60=10\ \text{Hz}$ ，源域转频 $fr,source=RPM/60f_{r,\text{source}}=\text{RPM}/60$ ，筛选 $∣fr,source−fr,target∣<ε|f_{r,\text{source}} - f_{r,\text{target}}| < \varepsilon$ （ $Hz\varepsilon=1\ \text{Hz}$ ，允许小范围误差）；
载荷适配性：目标域为实际列车（有载），排除源域0载荷样本，保留1/2/3马力样本；
传感器位置优先级：源域DE（驱动端）、FE（风扇端）信号故障特征显著，BA（基座）信号衰减严重，优先选择DE/FE信号构建 $D_S'$ 。

2. 故障特征提取模型

（1）时域特征（反映冲击脉冲特性）

对信号 $x (t)$ （长度为 $N$ ）提取5个统计特征：

均值： $μ=1N∑i=1Nxi\mu = \frac{1}{N}\sum_{i=1}^N x_i$ （反映信号整体水平）；
峭度： $\frac{1}{N}\sum_{i=1}^N \frac{(x_i - \mu)^4}{\sigma^4}$ （故障信号冲击性强，峭度值高于正常信号）；
峰峰值： $Xpp=max⁡(xi)−min⁡(xi)X_{\text{pp}} = \max(x_i) - \min(x_i)$ （反映信号波动幅度）；
方差 $σ2\sigma^2$ 、偏度 $S$ （辅助区分故障类型）。

（2）频域特征（反映故障特征频率）

对 $x (t)$ 做FFT得到频率谱 $X (f)$ ，计算功率谱密度 $PSD(f)\text{PSD}(f)$ ；
根据源域轴承参数（表1）计算故障特征频率：
- 外圈故障频率 $BPFO=fr⋅Nd2⋅(1−dD)\text{BPFO} = f_r \cdot \frac{N_d}{2} \cdot (1 - \frac{d}{D})$ ；
- 内圈故障频率 $BPFI=fr⋅Nd2⋅(1+dD)\text{BPFI} = f_r \cdot \frac{N_d}{2} \cdot (1 + \frac{d}{D})$ ；
- 滚动体故障频率 $BSF=fr⋅Dd⋅[1−(dD)2]\text{BSF} = f_r \cdot \frac{D}{d} \cdot [1 - (\frac{d}{D})^2]$ ；
提取 $PSD(f)\text{PSD}(f)$ 在 $BPFO/BPFI/BSF±Δf\text{BPFO/BPFI/BSF} \pm \Delta f$ （ $Hz\Delta f=50\ \text{Hz}$ ）范围内的最大值、均值作为频域特征。

（3）时频域特征（反映非平稳信号）

采用短时傅里叶变换（STFT） 将 $x (t)$ 转化为二维时频图 $T (f, t)$ ：

窗口长度：256（平衡时间/频率分辨率，确保故障特征频率可识别）；
归一化：将 $T (f, t)$ 缩放到 $[0, 1]$ ，作为深度学习模型的图像输入（保留时频联合信息）。

3. 源域诊断模型

采用“特征提取器+分类器”的CNN模型结构：

输入：STFT时频图（尺寸 $256 \times 256 \times 1$ ）；
特征提取器：3组“ $\times 3$ 卷积（ReLU激活）+ $\times 2$ 最大池化”（提取局部时频特征）；
分类器：2层全连接层+Softmax输出（4个类别：N/IR/OR/B）；
损失函数：交叉熵损失（处理多分类），结合SMOTE过采样（解决正常样本少的类别不平衡问题）。

4. 迁移学习模型（DANN）

针对目标域无标签特性，采用无监督域自适应模型DANN（Domain-Adversarial Neural Network） ：

结构：共享特征提取器（复用源域CNN的特征提取器）+ 任务分类器（源域故障分类）+ 域分类器（区分源/目标域）；
损失函数：总损失 $Ltotal=Ltask+λ⋅LdomainL_{\text{total}} = L_{\text{task}} + \lambda \cdot L_{\text{domain}}$ ，其中：
- $LtaskL_{\text{task}}$ ：源域分类交叉熵损失（最小化源域误差）；
- $LdomainL_{\text{domain}}$ ：域分类交叉熵损失（最大化域识别误差，迫使共享特征“域不变”）；
- $λ\lambda$ ：平衡系数（通过验证集调优，取0.1-1.0）；
域差异度量：用最大均值差异（MMD） 量化源/目标域共享特征的分布差异， $\|\frac{1}{m}\sum_{x \in X}\phi(x) - \frac{1}{n}\sum_{y \in Y}\phi(y)\|^2$ （ $ϕ\phi$ 为特征映射，MMD越小，域差异越小）。

5. 可解释性模型

选择“迁移过程可解释性+事后可解释性”结合：

过程解释：跟踪DANN训练中MMD值的变化（域差异缩小→迁移有效），可视化共享特征的TSNE降维结果（源/目标域特征重叠度提升→知识迁移成功）；
事后解释：用SHAP（SHapley Additive exPlanations） 计算目标域样本各特征维度的贡献度，验证贡献度最高的维度是否对应故障特征频率（符合故障机理）。

四、求解方法框架

按题目4项任务分步骤实施，确保每步可复现、结果可验证：

任务1：数据分析与故障特征提取

步骤1：源域数据预处理

数据加载：用Python（scipy.io）读取.mat文件，提取DE/FE信号、RPM、time变量；
去噪处理：采用小波阈值去噪（选择db4小波，软阈值，消除源域轻微噪声）；
信号截断：目标域采集时间8秒，源域信号截取1秒片段（避免冗余，保证特征一致性），若信号长度不足1秒，补零至1秒。

步骤2：源域数据筛选

根据“源域-目标域相似度指标”筛选，输出筛选后子集 $D_S'$ ：

转速筛选：计算 $fr,source=RPM/60f_{r,\text{source}}=\text{RPM}/60$ ，保留 $Hz9\ \text{Hz} \leq f_{r,\text{source}} \leq 11\ \text{Hz}$ 的样本；
载荷筛选：保留载荷为1/2/3马力的样本（排除0载荷）；
故障尺寸筛选：保留故障尺寸0.014-0.028英寸（排除过小尺寸0.007英寸，更接近实际列车故障）。

步骤3：多维度特征提取

时域特征：计算每个信号片段的 $μ、σ2、Xpp、K、S\mu、\sigma^2、X_{\text{pp}}、K、S$ ，组成5维时域特征向量；
频域特征：对去噪后信号做FFT，计算 $PSD\text{PSD}$ ，提取故障特征频率附近的最大值、均值，组成6维频域特征向量（BPFO、BPFI、BSF各2个特征）；
时频域特征：对去噪后信号做STFT（窗口长度256，重叠率50%），生成 $256 \times 256$ 时频图，归一化后作为CNN输入特征。

步骤4：特征融合（可选）

若采用传统机器学习（如SVM），将时域+频域特征向量拼接为11维特征向量；若采用深度学习，直接使用时频图作为输入（无需拼接）。

任务2：源域故障诊断

步骤1：数据集划分与平衡

划分比例： $D_S'$ 按8:2划分为训练集（80%）、测试集（20%），采用分层抽样（保证各故障类别比例不变）；
类别平衡：对训练集中的正常样本（N）采用SMOTE过采样，生成合成样本，使训练集中各类别样本数≥30个（避免模型偏向多数类）。

步骤2：CNN诊断模型训练

模型搭建：用TensorFlow/Keras搭建CNN，参数设置：
- 卷积层：32→64→128个卷积核（3×3），ReLU激活；
- 池化层：2×2最大池化，步长2；
- 全连接层：512→256个神经元，Dropout(0.5)防止过拟合；
- 输出层：4个神经元，Softmax激活；
训练参数：Adam优化器（学习率0.001），batch size=32， epochs=80，早停（patience=10）防止过拟合。

步骤3：模型评价

在测试集上计算以下指标，绘制混淆矩阵：

宏观指标：准确率（Accuracy）、宏观召回率（Macro-Recall）、宏观F1（Macro-F1）；
类别指标：各类别（N/IR/OR/B）的精确率、召回率（重点关注正常样本的召回率，避免漏诊）；
验收标准：测试集准确率≥95%，否则调整模型结构（如加入残差块）或优化特征提取。

任务3：迁移诊断

步骤1：目标域数据预处理

数据加载：读取16个目标域样本（A-P），提取振动信号；
统一采样频率：目标域采样频率32KHz，源域筛选后为12/48KHz，将目标域信号重采样至24KHz（折中值，减少频率差异）；
特征提取：与源域一致，生成目标域样本的时频图（输入DANN模型）。

步骤2：DANN迁移模型训练

模型初始化：共享特征提取器加载任务2中训练好的CNN权重（冻结前2层卷积，只训练后1层卷积，保留源域知识）；
对抗训练：
- 阶段1：固定共享特征提取器，训练任务分类器（源域分类）和域分类器（源/目标域区分），各训练10轮；
- 阶段2：联合训练三部分，最小化 $LtotalL_{\text{total}}$ ，每轮计算源/目标域特征的MMD值，直至MMD值稳定（变化<0.01）；
超参调优：通过验证集（源域训练集的10%）调整 $λ\lambda$ ，选择MMD最小、源域分类准确率最高的 $λ\lambda$ （通常 $λ=0.5\lambda=0.5$ ）。

步骤3：目标域分类与标签标定

分类预测：将目标域16个样本输入训练好的DANN，任务分类器输出类别概率，取概率最大的类别作为标签；
机理验证：对每个预测样本，绘制其频域频谱，检查是否存在对应类别的故障特征频率（如预测OR则检查BPFO），若存在则标签可靠，否则重新预测；
结果输出：整理16个样本（A-P）的标签，格式为“样本编号-预测类别-概率-验证结果”。

步骤4：结果可视化

特征降维可视化：用TSNE将源域训练集、源域测试集、目标域样本的共享特征降维至2D，绘制散点图（颜色区分类别），展示迁移后目标域样本与源域类别的聚类情况；
混淆矩阵：绘制目标域分类结果的混淆矩阵（虽无真实标签，但可展示模型对各类别的预测分布）；
信号对比图：选取预测为IR、OR、B、N的典型样本，绘制其时域波形和频域频谱，标注预测类别及对应故障特征频率。

任务4：迁移诊断的可解释性分析

步骤1：迁移过程可解释性

MMD变化曲线：绘制DANN训练过程中MMD值随轮次的变化，若曲线呈下降趋势并稳定，说明域分布差异缩小，知识有效迁移；
卷积核激活可视化：对共享特征提取器的最后一层卷积核，绘制其对目标域典型样本的激活热力图，观察激活区域是否覆盖故障特征频率对应的频段（如OR样本激活BPFO频段）。

步骤2：事后可解释性

SHAP值分析：用SHAP库计算目标域每个样本的SHAP值，绘制SHAP summary plot，展示各特征维度（时频图的频率-时间点）对预测结果的贡献度；
案例验证：选取预测为“IR”的样本（如样本C），绘制SHAP依赖图，展示贡献度最高的特征维度（如100-150Hz频段，对应IR的BPFI频率）与预测概率的关系，验证该频段信号增强时，IR预测概率显著提升，符合内圈故障机理；
结论输出：总结模型决策的关键特征与故障机理的一致性，证明模型决策并非随机，而是基于故障相关特征。