Predicting Defective Lines Using a Model-Agnostic Technique
(使用模型不可知技术预测缺陷语句)
an Explainable AI technique that provides information why the model makes such a prediction
本文章提出了一个技术,可以对为什么做出这个判断提供依据。
直觉:常常出现在过去的缺陷文件中的代码令牌( tokens )也可能出现在发布后将修复的行。
动机分析:也就是示例文件中,如果是文件粒度的话,所有的100代码都需要耗费SQA精力。而如果是method-level级别的,假设缺陷method有30行,则它需要的SQA精力只是file-level的30%。若是line-level则需要的SQA精力则更少。我们用缺陷行占的比例来量化SQA精力。可能只有5条.
LINE-DP框架:
个人理解步骤:
1, 根据现有的缺陷数据集,提取出标签(i,e 真实缺陷)和toke