化学知识的数据挖掘与发现:DMOS系统的应用与优化
1. 数据挖掘技术概述
在化学领域的数据挖掘中,不同的数据挖掘技术适用于不同类型的数据集,没有一种通用的方法能适用于所有情况。因此,线性和非线性的数据挖掘技术都被应用于数据挖掘优化系统(DMOS)中,包括K近邻(KNN)、偏最小二乘法(PLS)、主成分分析(PCA)、Fisher判别分析(FDA)、人工神经网络(ANN)、遗传算法(GA)和支持向量机(SVM)等,此外,一些实验室开发的新技术,如超多面体(HP)也被应用其中。
1.1 常见数据挖掘技术介绍
- PLS :在化学计量学中,广泛用于对多变量测量之间的线性关系进行建模。
- PCA :核心思想是在保留数据集尽可能多的变异信息的同时,减少由大量相关变量组成的数据集的维度。
- FDA :一种线性降维技术,旨在最大化不同类别之间的分离度。
- KNN :在大量分类问题中表现出色。
- ANN :一种自适应系统,可用于对输入和输出之间的复杂关系进行建模,或在数据中寻找模式,在建模非线性关系方面备受关注。
- GA :一种先进的优化技术,模拟自然界中的选择过程,在DMOS中,基于GA的算法用于在n维空间中搜索最优参数。
- SVM :在机器学习活动中越来越受欢迎,包括分类、回归和异常值检测等,在处
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



