基于CodeBERT的边缘云系统软件缺陷预测
1. 引言
边缘云系统是现代社会创新中至关重要的计算基础设施,能够以低延迟收集和处理大数据。随着对边缘云系统的关注度不断提高,为确保其可靠性而进行的测试研究也日益活跃。然而,由于边缘云系统结构复杂、源代码量大,且工作在地理和概念上分散的环境中,用于测试的资源总是有限的。
软件缺陷预测(SDP)是一种通过智能预测模型来预测易出现缺陷的模块,从而将有限的资源优先分配到这些模块上的技术。以往SDP的研究主要集中在使用C和JAVA语言编写的传统项目上,而在边缘云项目中应用SDP的研究尚未开展。因此,本文聚焦于使用Go语言编写的边缘云项目,提出了基于CodeBERT的即时(JIT)软件缺陷预测模型。
CodeBERT是一个在大量编程语言(PL)和自然语言(NL)对上进行预训练的强大深度学习双语模型,适用于直接应用于使用Go语言编写的项目。JIT SDP则是SDP的一种类型,它基于历史提交数据预测易出现缺陷的提交。由于每个提交都包含NL的提交消息和PL的源代码,CodeBERT可以生成压缩提交信息的嵌入向量,进而对其进行微调以预测易出现缺陷的提交。
为了评估该模型的性能,我们选择了两个使用Go语言编写的边缘云系统开源框架项目,并通过一种新颖的方法从GitHub平台收集和标记缺陷数据,生成了GitHub拉取请求(GHPR)数据集。然后在项目内和跨项目环境中对模型进行评估。实验结果表明,SDP可以在边缘云项目中有效应用,所提出的方法有助于解决边缘云系统测试时的资源限制问题。
2. 背景和相关工作
2.1 边缘云系统与软件缺陷预测(SDP)
边缘云计算带来了智能工厂
超级会员免费看
订阅专栏 解锁全文
1041

被折叠的 条评论
为什么被折叠?



