Predicting Defective Lines Using a Model-Agnostic Technique(笔记)

本文介绍了一种可解释的人工智能技术,通过动态地使用token特征训练模型预测代码缺陷。LINE-DP框架包括:从缺陷数据集中提取特征训练预测模型;利用Lime方法生成实例并预测;建立线性回归模型(K-Lasso)确定特征重要性;根据系数计算语句风险分数并排序。该方法不依赖现有预测模型,重点关注对缺陷预测有正面影响的前20个特征。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Predicting Defective Lines Using a Model-Agnostic Technique

使用模型不可知技术预测缺陷语句
an Explainable AI technique that provides information why the model makes such a prediction
本文章提出了一个技术,可以对为什么做出这个判断提供依据。

直觉:常常出现在过去的缺陷文件中的代码令牌( tokens )也可能出现在发布后将修复的行。
动机分析:也就是示例文件中,如果是文件粒度的话,所有的100代码都需要耗费SQA精力。而如果是method-level级别的,假设缺陷method有30行,则它需要的SQA精力只是file-level的30%。若是line-level则需要的SQA精力则更少。我们用缺陷行占的比例来量化SQA精力。可能只有5条.
在这里插入图片描述

LINE-DP框架
在这里插入图片描述

个人理解步骤:

1, 根据现有的缺陷数据集,提取出标签(i,e 真实缺陷)和toke

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值