数据挖掘与机器学习在软件测量中的应用
在软件开发领域,准确测量软件的各种属性,如质量和数量,对于按时、按成本交付高质量软件至关重要。数据挖掘(DM)和机器学习(ML)技术为实现这一目标提供了有效的手段。
1. 数据挖掘技术用于软件工作量估算
数据挖掘技术在软件工作量估算方面发挥着重要作用,下面介绍几种常见的数据挖掘技术。
- MARS(多元自适应回归样条) :由Milton Friedman引入的一种新的非线性统计回归技术。其主要目标是基于自变量或预测变量来预测连续因变量的值或结果变量。该技术不预设预测变量和结果变量之间的关系,而是从中挖掘有用的模型。
- CART(分类与回归树) :由Leo Breiman、Jerome Friedman、Richard Olshen和Charles Stone于1984年开发。这是一种非参数技术,能轻松处理异常值。通过分类树可以识别目标变量的类别,回归树则用于预测目标变量的值。在CART中,变量无需提前选择,该技术会根据变量的重要性自动识别并剔除不重要的变量。
- OLS(普通最小二乘法) :这是最古老且最常用的数据挖掘技术,用于计算软件系统的工作量估算。OLS以无偏的方式进行统计估计,通过最小化观测变量和预测变量之间差值的平方和来实现。
这些数据挖掘技术与软件成本估算模型相结合,可以对项目进行分类,并根据过去项目的数据生成新项目的近似估算,从而提高软件工作量估算的准确性。
2. 机器学习技术用于实证软件测量
机器学习技术在实证软件测量中也有广泛应用,主要从软件质量和数
超级会员免费看
订阅专栏 解锁全文

17万+

被折叠的 条评论
为什么被折叠?



