归纳与类比学习:助力流程操作的数据驱动式改进
在当今制造业中,数据的积累量正以惊人的速度增长。高效且具有竞争力的制造已成为一项信息密集型活动,大量的操作数据被常规收集和存储。然而,如何从这些数据中提取有价值的信息,以实现制造系统的持续改进,是一个亟待解决的问题。本文将介绍一种基于归纳和类比学习的方法,旨在从制造系统的运营数据中提取结构化的新知识,为系统性能提升提供支持。
1. 引言
随着硬件、数据库管理和信息处理系统的飞速发展,制造业的数据收集量大幅增加。一些工厂甚至可以连续监控和存储多达20,000个变量。制造企业若想成为学习型组织,实现持续且无止境的改进,尤其是在制造质量方面,就需要更好地管理运营数据。
传统上,过程运营质量的管理包含两个步骤:一是将过程控制在预定范围内,二是持续改进过程性能。但对于一些涉及固体处理的工厂,由于其物理化学现象复杂,难以用第一性原理模型描述,大量积累的运营数据并未得到有效利用。
现有的统计、质量管理和优化数据分析工具虽能探索测量记录并挖掘有用信息,但都需要用户做出大量假设和先验决策,且这些工具更注重数值准确性,而忽视了实质性知识的提取,其解决方案的表达格式也难以被人类操作员理解和实施。
本文提出的方法旨在开发无需假设的学习框架和方法,从无法用第一性原理定量模型有效描述的工厂现有数据中挖掘性能改进机会,并以合适的格式表达这些机会。
2. 学习任务的一般问题陈述和范围
问题的一般形式为:给定一组现有的 (x, y) 数据记录,其中 x 是操作或决策变量的向量,被认为会影响 y 的取值;y 是性能指标,通常被假定为所分析产品或过程的质量特征。目标是学习如何将系统性能提升