自动化技术在基础设施管理中的应用与发展
1. 数据特征关系与特征选择方法
从数据中提取的特征之间存在三种一般关系:相关(related)、附加(additional)和无关(unrelated)。无关特征不包含关于目标的重要信息,应予以去除。特征去除方法通常分为以下四类:
1. 过滤方法(Filter methods) :使用运算符进行预处理以对属性进行排名,选择排名高的属性用于预测。其他特征在处理中起附加作用,最终通过最优特征向量提高速度和准确性。
2. 包装方法(Wrapper methods) :特征选择的标准取决于预测器的性能。预测器被置于搜索算法中,寻找具有最高预测性能的子集。这是一种优化方法,旨在最大化性能并最小化特征数量。
3. 嵌入式方法(Embedded methods) :在训练过程中选择变量,无需将数据划分为训练集和测试集。
4. 混合方法(Hybrid methods) :结合上述三种方法。
特征选择方法的选择取决于问题类型和特征质量,最佳策略是针对具体问题开发特定方法,这需要正确识别特征之间的关系并理解特征的概念。
2. 分类方法及其在基础设施管理中的应用
分类是一种预测和计算方法,旨在猜测数据在某个类别中的位置。若输出是分类的,则该方法称为分类;若输出是数值的,则称为回归。描述性建模或聚类是将每个输入分配到一个簇中,使相似输入位于同一簇。通过观察相似数据之间的关系,可以发现输入之间的关联规则。
分类在基础设施管理的研究和
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



