制造系统中决策树作为数据挖掘工具的应用
1. 数据挖掘概述
数据挖掘有五个主要参数,使其成为许多领域中流行的工具,分别是分类、预测、关联、聚类以及序列或路径分析。
- 分类 :在待分析的数据中寻找新的模式,这可能会导致数据组织形式的改变。
- 预测 :发现数据中的模式,从而对未来做出合理的预测。
- 关联 :寻找一个事件与另一个事件相关联的模式。
- 聚类 :找到并直观记录事实组。
- 序列 :以特定方式排列数据。
数据挖掘能够通过挖掘大型数据库的潜在知识,为组织提供显著的竞争优势。近年来,已经为包括营销、金融、银行、制造和医疗保健等多个领域开发了许多数据挖掘应用程序和原型。虽然在制造领域报告的案例不多,但所有这些定义的共同点都基于数据挖掘的原则和技术,这些原则和技术在许多领域都被广泛接受。
数据挖掘可以被看作是从存储在数据库、数据仓库或其他信息存储库中的大量数据中发现有用知识的过程。它是一个多学科领域,集成了数据库、统计、机器学习、信号处理和高性能计算等技术。通过将这些定义应用于制造领域,可以挖掘不同地区客户的购买数据,以发现不同地区客户的比较购买力、对某些商品的口味偏好、所有地区最受欢迎的商品等模式。
数据挖掘也可以被定义为使用工具分析数据库中的数据,在不了解数据含义的情况下寻找趋势或异常。它利用网站收集的大量信息来寻找用户行为模式,也可以被称为筛选数据以识别模式并建立关系。需要注意的是,统计程序和专家系统不能用于从数据
决策树在制造系统数据挖掘中的应用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



