英文名称:Cross-Attribute adaptation networks: Distilling transferable features from multiple sampling-frequency source domains for fault diagnosis of wind turbine gearboxes
中文名称:跨属性自适应网络:从多个采样频率源域中提取可转移特征,用于风力涡轮机齿轮箱的故障诊断
发展前景:
用于故障诊断的多源域自适应已开始受到研究人员的关注,它可以从多个源域中学习域不变特征,并获得更好、更稳定的性能;与传统的单域自适应方法相比,多域自适应方法获得了更高的故障诊断精度,此外,详细的可视化分析表明,与单域自适应方法相比,多域自适应方法可以获得更全面、更通用的特征。域自适应是迁移学习的一个代表,可以通过从源域学习特征并应用于目标域中的任务来解决标记数据不足的问题。域自适应的主要思想是将源域和目标域中的数据映射到高维潜在特征空间,然后最小化源域和目标域之间特征分布的差异。因此,该模型可以用标记的源域数据进行训练,并且适合于目标域中的任务。
存在问题:
但是,上述方法存在两个问题。一个问题是,上述多源域自适应方法仅考虑与目标域相同的采样频率源域,可能无法满足实际工业应用。由于结构复杂,传动比高,不同部件的转速多种多样,因此需要应用不同采样频率的传感器来采集不同部件的振动响应。另一个问题是,在上述多源域自适应方法中,每个源域和目标域对之间的独特信息被忽略了。在风电场中,由于每个风力发电机组的实际地理位置不同,风力涡轮机的风力、风向和叶片速度各不相同,导致每个风力涡轮机齿轮箱的振动响应存在差异。此外,由不同采样频率的传感器获得的收集数据的分布包括一般特征和独特特征,两者都由判别性故障特征组成。
创新点
针对上述问题,提出一种新的交叉属性自适应网络(CAAN)用于风力发电机齿轮箱故障诊断。该方法首先以CNN模型为主干,同时提取多源域和目标域数据之间的域不变特征。然后,应用通道注意机制构造与源域数目相等的特征提取器,进一步学习不同采样频率数据中的特征,并在高维空间中权衡通道特征的重要性,实现跨属性学习。接下来,采用多个分类器来预测每个源域中的健康状态。此外,考虑到在每个源域的分类器的差异,均方误差(MSE)被用来对齐每对分类器。最后,在多个层中利用多核MMD来减少每对源域和目标域之间的差异。本文的动机是探索可转移的知识从多个采样频率的源域的风力涡轮机齿轮箱,并进一步,自适应地提取的一般特征和独特的特征之间的不同的源域与不同的采样频率。本文的主要贡献概括如下:
1、提出一种具有多分支框架的跨属性自适应网络,从多个采样频率源域中学习域不变特征。
2、具有注意力机制的特定特征提取器进一步考虑了不同采样频率数据中的特定信息,自适应学习具有区分性的域不变特征。
3、考虑到使用不同源域训练的分类器之间的差异,MSE被用作分类器对齐策略的目标函数,这有助于构造更精确的决策边界。
4、该方法利用实际风力发电机齿轮箱的振动数据实现了端到端学习。
摘要
风力涡轮机齿轮箱的振动信号通常在各种采样频率下收集。然而,大多数传统的域自适应方法(用于提高有限或未标记数据集的故障诊断精度)仅考虑具有相同采样频率的单个源域。该文提出一种新型域不变特征学习方法,即跨属性自适应网络(CAAN),其中具有特定采样频率的每个源域具有单独的特征学习和自适应模块。具体来说,该文开发了一种具有注意力机制的多分支框架,分别学习和权衡多个采样频率数据的特征。然后,将多个分类器和域之间的差异最小化,以建立精确的决策边界。对真实的风力涡轮机齿轮箱数据集进行了广泛的实验分析,以证明所提出的CAAN的有效性和优势。
理论知识
1、最大平均偏差(Maximum mean discrepancy)
本文将MMD应用于测量多个源域与目标域之间的差异。
2、通道注意力模块(Channel attention module)
由于深度学习模型的自适应特征提取的优点,可以通过多个卷积层从输入数据中获得多通道高维特征。在模型训练过程中,随机初始化各卷积核滤波器的参数。随着模型的迭代优化,卷积核滤波器的参数也被优化,以从原始输入数据中获得有区别的多通道特征。**然而,并非所有通道特征对所有类别的分类结果具有相同的影响。具体而言,一些渠道特征对于特定类别具有更重要的权重,但对于其他类别则较弱。**一般来说,源域和目标域中的共同特征通常由通用特征提取器获得。这些特征中的不同通道表示不同的域不变特征。此外,由于多个源域中的各种采样频率,在每个源域的一般特征中存在特定特征。因此,采用相同的通道权值来反映可传递的特征是不合适的。通道注意力模块通过共享网络学习一系列通道注意力系数,可以很好地解决上述问题。
通道注意力模块的主要结构如图所示。通道注意力模块中有三个主要步骤。首先,应用平均池化和最大池化操作两者以获得平均池化特征和最大池化特征。其次,利用共享网络分别产生双通道注意力图。第三,采用逐元素求和的方法合并两个通道的注意力图,并将合并结果输入激活函数,得到最终的通道注意力。
主要研究思路
网络架构
所提出的CAAN主要由五个部分组成:输入、通用特征提取器、特定特征提取器、域适配和输出。
在所提出的CAAN方法中,所有的多个源域数据和目标域数据被馈送到一个通用的特征提取器,然后被分成多个分支,其数量由源域的数量决定。每个分支由其余特定特征提取器、域适应和输出组成。特别是在测试阶段,最终的预测目标标签是通过最后一个全连接层中的预测结果的平均值来计算的。
所提出的特定特征提取器包含卷积层C41/C42/C4 N和通道注意模块,可进一步促进模型从多个采样频率源域中学习潜在的唯一故障特征。自适应模块用于前两个全连接层(FC 1x,FC 2x),采用MMD分别测量每对源域和目标域之间的边际概率分布差异。模型的输出在训练阶段和测试阶段之间有很大的不同。在训练阶段,将第三个全连接层(FC 3x/Classifier)作为每个源域的输出,实现所有分支中源域的分类和反向传播。而在测试阶段,测试数据是在每个分支分别计算。最终输出定义为所有分支中第三个全连接层的平均值。SoftMax 用于在所有训练和测试阶段将输出映射到标签空间。在本文中,默认的网络结构,和所提出的CAAN的参数在表1中列出。
由通用特征提取器提取的通用特征表示所有源域和目标域之间的通用信息。由于源域的采样频率不同,采用额外的卷积层来进一步探索基于共同特征的唯一故障信息。此外,高维空间中不同通道特征的重要性是独特的。对所有通道特征应用相同的权重是不明智的。为了解决这个问题,应用通道注意力模块来挤压高维特征图的空间维度,然后将高维特征相乘以获得特定特征,如图3所示。考虑到计算复杂度,共享网络采用两个卷积层,内核大小为1 × 1,与额外的卷积层相同。