7、软件可靠性评估与变更倾向预测研究

软件可靠性评估与变更倾向预测研究

1. 软件可靠性评估

1.1 模型评估

在将数据集拟合到模型后,最后一步是评估模型的性能。在Keras中,可以使用 evaluate() 函数来完成这一任务,该函数需要两个参数,分别作为输入数据和输出数据。

1.2 数据集选择

为了评估所提出技术的性能,选用了Firefox和Eclipse数据集。从Bugzilla的官方网站收集了记录在缺陷跟踪系统中的缺陷数据,共提取了10,000个故障数据集。其中,80%的缺陷数据用于训练,其余20%用于测试所提出方法的性能。

1.3 结果分析

从Bugzilla获得的数据集需要进行分析和预处理,因为直接使用从缺陷跟踪系统获得的数据集是一项困难的任务。
- 八类故障级别分析 :最初,在缺陷跟踪系统的目标变量上应用了八个故障级别。利用8000个缺陷的训练数据,使用基于神经网络和深度学习的两种技术来估计2000个缺陷测试数据的故障级别。结果表明,基于深度学习的识别方法呈现出令人信服的结果。具体识别率如下表所示:
| 方法 | 识别率(%) |
| — | — |
| 神经网络 | 8.023 |
| 深度学习 | 49.743 |
- 两类故障级别分析 :为了检查所提出方法的效率,仅考虑了两种类型的故障级别(关键和非关键)。将八个故障级别分为两类,第一类包含轻微、增强、次要、正常、回归、阻塞,第二类包含主要和关键故障级别。第一类赋值为索引1,第二类赋值为索引2。使用8000个学习数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值