1.1 轴承故障数据预处理与时频图提取

机器鱼

已于 2025-04-05 17:51:26 修改

阅读量1.1k

点赞数 11

分类专栏： Python神经网络1000个案例分析文章标签： python 故障诊断

于 2025-03-31 22:37:36 首次发布

本文链接：https://blog.youkuaiyun.com/qq_41043389/article/details/146886928

版权

Python神经网络1000个案例分析专栏收录该内容

27 篇文章

订阅专栏

本博客来源于优快云机器鱼，未同意任何人转载。

更多内容，欢迎点击本专栏，查看更多内容。

0 数据集分析

数据来源于凯斯西储大学的滚动轴承故障诊断，数据集介绍参考【博客】，下载就自己网上找，到处都是资料。

数据集如下：这是我从网上下的，只下了48k采样频率的数据，48k代表采样频率48kHz，DriveEnd代表是驱动端，B、IR、OR分别是球体Ball、内圈InnerRace，外圈OuterRace的故障，007、014、021代表轴承直径(英寸)，0代表0马力负载，normal代表正常类型，一共10种，后续我们将建立10分类的故障诊断网络。其他负载与采样频率的后续有空再研究。我用的数据可以在【地址】这里免费下载。

1 数据划分

每种故障数据都是一个几百k长度的振动信号，而我们做神经网络需要很多样本，因此采用随机采样的方式进行数据预处理，具体操作如下

步骤①计算数据data长度，得到长度length；

步骤②在0-(length-L)的范围内随机生成一个数start，end=start+L；取数据data[start:end]作为一样样本；

步骤③循环②共N次，得到N个样本；对每种数据都训练N次，得到10N个样本。

步骤④随机9:1划分得到训练集与测试集。完整代码如下：

# -*- coding: utf-8 -*-
import os
from scipy.io import loadmat,savemat
import numpy as np
from sklearn.model_selection import train_test_split
np.random.seed(0)
# In[]
lis=os.listdir('./data/')
N=200;Len=1024 #每种故障取N个样本，每个样本长度是Len
# 一共10类 标签是0-9
data=np.zeros((0,Len))
label=[]
for n,i in enumerate(lis):
    path='./data/'+i
    print('第',n,'类的数据是',path,'这个文件')
    file=loadmat(path)
    file_keys = file.keys()
    for key in file_keys:
        if 'DE' in key:
            files= file[key].ravel()
    data_=[]
    for i in range(N):
        start=np.random.randint(0,len(files)-Len)
        end=start+Len
        data_.append(files[start:end])
        label.append(n)
    data_=np.array(data_)
    
    data=np.vstack([data,data_])
label=np.array(label)
# 9：1划分数据集
train_x,test_x,train_y,test_y=train_test_split(data,label,test_size=.1,random_state=0)
# In[] 保存数据
savemat('result/data_process.mat',{'train_x':train_x,'test_x':test_x,
                                   'train_y':train_y,'test_y':test_y})

2 特征提取

直接采用时域信号做分类，效果一般都不好。通常的做法是①提取时域特征，如均值、方差、极大极小值。②提取频域特征，如快速傅里叶变换、小波变换。③提取时频域特征，如短时傅里叶变换、连续小波变换、希尔伯特-黄变换等。本博客采用的特征提取为连续小波变换时频图，从原本的时域信号中提取得到时频域特征。代码如下

# -*- coding: utf-8 -*-
import matplotlib.pyplot as plt
# 每种故障取一个样本出来画图举例
import numpy as np
import pywt
import os
from scipy.io import loadmat
# In[]
lis=os.listdir('./data/')
Len=1024
data=[]
for n,i in enumerate(lis):
    path='./data/'+i
    print('第',n,'类的数据是',path,'这个文件')
    file=loadmat(path)
    file_keys = file.keys()
    for key in file_keys:
        if 'DE' in key:
            files= file[key].ravel()
    start=np.random.randint(0,len(files)-Len)
    end=start+Len
    data.append(files[start:end])
# In[] 参数设置
for i in range(10):
    sampling_rate=48000# 采样频率
    wavename = 'cmor3-3'#cmor是复Morlet小波，其中3－3表示Fb－Fc，Fb是带宽参数，Fc是小波中心频率。
    totalscal = 256
    fc = pywt.central_frequency(wavename)# 小波的中心频率

    cparam = 2 * fc * totalscal
    scales = cparam / np.arange(totalscal, 1, -1)
    [cwtmatr, frequencies] = pywt.cwt(data[i], scales, wavename, 1.0 / sampling_rate)
    
    t=np.arange(len(data[i]))/sampling_rate
    plt.figure()
    plt.plot(t, data[i])
    plt.xlabel('Time/s')
    plt.ylabel('Amplitude')
    plt.title('Fault type'+str(i))
    plt.savefig('result/Fault type'+str(i)+' Signal.jpg')
    plt.close()
    plt.figure()
    t,frequencies = np.meshgrid(t,frequencies)
    plt.pcolormesh(t, frequencies, abs(cwtmatr),cmap='jet')    
    plt.xlabel('Time/s')
    plt.ylabel('Frequency/Hz')  
    plt.title('Fault type'+str(i))
    plt.savefig('result/Fault type'+str(i)+' Spectrum.jpg')
    plt.close()

写一个循环，将【0】得到的数据集依次提取出来，即可得到需要的数据集，数据保存成n_c.jpg的格式，n代表第n个样本，c代表样本对应的类别，代码如下所示：

# -*- coding: utf-8 -*-
# 对所有样本依次计算时频图 并保存
from threading import Thread
import matplotlib.pyplot as plt
import numpy as np
import pywt
from scipy.io import loadmat
import os
import shutil
shutil.rmtree('image/')
os.mkdir('image/')
os.mkdir('image/train')
os.mkdir('image/test')
# In[]
def Spectrum(data,label,path):
    label=label.reshape(-1,)
    for i in range(data.shape[0]):
        sampling_rate=48000# 采样频率
        wavename = 'cmor3-3'#cmor是复Morlet小波，其中3－3表示Fb－Fc，Fb是带宽参数，Fc是小波中心频率。
        totalscal = 256
        fc = pywt.central_frequency(wavename)# 小波的中心频率
        cparam = 2 * fc * totalscal
        scales = cparam / np.arange(totalscal, 1, -1)
        [cwtmatr, frequencies] = pywt.cwt(data[i], scales, wavename, 1.0 / sampling_rate)
        t=np.arange(len(data[i]))/sampling_rate

        t,frequencies = np.meshgrid(t,frequencies)
        plt.pcolormesh(t, frequencies, abs(cwtmatr),cmap='jet')    
        plt.axis('off')
        plt.savefig(path+'/'+str(i)+'_'+str(label[i])+'.jpg', bbox_inches='tight',pad_inches = 0)
        plt.close()

data=loadmat('result/data_process.mat')
Spectrum(data['train_x'],data['train_y'],'image/train')
Spectrum(data['test_x'],data['test_y'],'image/test')
# 用多线程快一点
# p1 = Thread(target=Spectrum, args=(data['train_x'],data['train_y'],'image/train'))
# p2 = Thread(target=Spectrum, args=(data['test_x'],data['test_y'],'image/test'))
# p1.start()
# p2.start()
# p1.join()
# p2.join()