利用多条生产线数据提升深度学习模型性能
在钢铁制造过程中,准确预测关键指标(如温度、碳含量和磷含量)对于提高生产效率和产品质量至关重要。然而,由于数据分布有限、传感器数据不足等问题,传统的机器学习模型在捕捉复杂过程的依赖关系时面临挑战。本文介绍了一种利用多条生产线数据进行联合训练的方法,以提高模型的预测准确性。
1. 背景与动机
在钢铁生产中,收集到的过程数据大多来自控制良好的生产执行过程,数据分布相似。但机器学习方法需要包含各种过程执行分布的训练数据,才能捕捉复杂过程的依赖关系。由于缺乏变化和过程中传感器数据,数据分布和分辨率有限,限制了训练模型对物理过程的理解。为了充分捕捉熔炉过程的复杂性,需要充分利用收集到的数据。使用多个熔炉的数据可以提供更多、更丰富的训练数据,结合更复杂的机器学习算法,模型可以捕捉实际过程中更多未知的依赖关系,甚至发现典型熔炉过程中存在的通用依赖关系。
该方法的联合训练方面受到迁移学习的启发。迁移学习常用于处理特定问题数据集有限且复杂度高的情况,在许多领域都有良好表现。但本文的情况有所不同,该领域没有可用于预训练的大型通用数据集。本文通过为多个较小的数据集学习共同抽象,挖掘数据中潜在的共同信息,用多个小数据集的组合替代大型数据集。
2. 方法
2.1 数据收集与处理
数据来自瑞典 SSAB 集团的工业 LD 转炉的实际生产,涵盖三个不同的 BOF 生产线,分布在两个不同的生产地点。这产生了三个不同的数据集,它们有一些重叠特征,也有各自独特的特征。部分特征的收集方式相同,部分则有不同的表示。某些熔炉未收集某些特征,而某些熔炉对特定参数有独特而详细的数据收集。三个数据集分别测量并存储了 55
超级会员免费看
订阅专栏 解锁全文
4972

被折叠的 条评论
为什么被折叠?



