深度学习测试-DeepXplore

本文探讨了深度学习测试的重要性,尤其是由于对抗攻击带来的不鲁棒性问题。DeepXplore是首个深度学习白盒测试标准,提出了神经元覆盖率(Neuron Coverage)来评估测试充分性。通过联合优化问题生成新输入,提升模型的准确性和鲁棒性。实验表明,神经元覆盖率优于传统的代码覆盖率,且不同类别数据能激活更多神经元。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(一)为什么研究深度学习的测试方法

深度学习应用广泛

Deep Learning system目前很火,已经应用于多个领域,包括图像识别、语音识别,同时自动驾驶及流氓软件的检测等问题上也已经开始使用。

深度学习并不鲁棒

对抗攻击:
图像经过针对深度学习模型的对抗攻击,对图片增加噪点,合成出新的图像。该图像人眼识别没有改变,却使得深度学习模型产生了错误的行为。
在安全性要求极强的领域中,如自动驾驶问题,并不鲁棒的模型可能会导致无法承受的后果,所以迫切需要对DL system有效的测试方法,来验证DL system是否鲁棒。

(二)DeepXplore

启示(idea)

传统软件需要充分的测试来保证其鲁棒性,同样深度学习系统也需要测试。
在测试传统软件时,代码覆盖率(即:测试案例执行代码语句占所有语句的百分比)是衡量系统测试充分性的重要指标。
将这一思想映射到深度学习系统中:测试集执行深度学习系统的占比,作为衡量深度学习系统测试充分性的重要指标。

DeepXplore的贡献

(1)神经元覆盖率:Neuron Coverage
深度学习系统第一个白盒测试标准,用来评估一组测试集所执行的逻辑量。
(2)生成新输入集(可以触发深度学习系统不同的逻辑)
建立联合优化问题,利用梯度来进行求解,最终生成新的输入集。联合优化问题有两个目标:最大化神经元覆盖率,最大化差异行为(differential behaviors)。
(3)新输入集自动打label
训练多个DNN,输入input后,多个DNN进行投票。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值