软件可靠性评估与变更倾向预测研究
1. 软件可靠性评估
1.1 模型评估
在将数据集拟合到模型后,最后一步是评估模型的性能。在Keras中,可以使用 evaluate() 函数来完成这一任务,该函数需要两个参数,分别作为输入数据和输出数据。
1.2 数据集选择
为了评估所提出技术的性能,选用了Firefox和Eclipse数据集。从Bugzilla的官方网站收集了记录在缺陷跟踪系统中的缺陷数据,共提取了10,000个故障数据集。其中,80%的缺陷数据用于训练,其余20%用于测试所提出方法的性能。
1.3 结果分析
从Bugzilla获得的数据集需要进行分析和预处理,因为直接使用从缺陷跟踪系统获得的数据集是一项困难的任务。
- 八类故障级别分析 :最初,在缺陷跟踪系统的目标变量上应用了八个故障级别。利用8000个缺陷的训练数据,使用基于神经网络和深度学习的两种技术来估计2000个缺陷测试数据的故障级别。结果表明,基于深度学习的识别方法呈现出令人信服的结果。具体识别率如下表所示:
| 方法 | 识别率(%) |
| — | — |
| 神经网络 | 8.023 |
| 深度学习 | 49.743 |
- 两类故障级别分析 :为了检查所提出方法的效率,仅考虑了两种类型的故障级别(关键和非关键)。将八个故障级别分为两类,第一类包含轻微、增强、次要、正常、回归、阻塞,第二类包含主要和关键故障级别。第一类赋值为索引1,第二类赋值为索引2。使用8000个学习数
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



