gRoMA:测量深度神经网络全局鲁棒性的工具
1. 引言
深度神经网络(DNNs)在许多分类应用中已成为基础组件,在经验上,DNNs 常常优于传统软件,甚至超越人类。然而,DNNs 有一个显著的缺点:它们极易受到微小输入扰动(即对抗性输入)的影响,这些扰动可能导致它们产生错误的输出。这种对抗性输入可能会延迟 DNNs 在安全关键领域(如航空航天、自动驾驶汽车和医疗设备)的应用。
在这些关键领域,系统必须满足高可靠性标准。虽然对于手工编写的软件有严格的认证指南,但对于包含 DNNs 的系统,目前还没有这样的认证指南。监管机构已经认识到这一差距的存在以及解决它的重要性,但认证 DNNs 的鲁棒性仍然是一个未解决的问题。
目前,形式化方法社区已经开始解决测量 DNNs 局部鲁棒性的问题,但这些方法在网络规模增大时往往难以扩展,限制了它们的实际应用。为了克服这一限制,人们提出了近似方法,但这些方法通常以降低精度为代价。而且,现有的工作几乎都集中在测量局部鲁棒性上,而在 DNN 认证的背景下,需要一个更广泛的视角来测量整个输入空间上的全局鲁棒性。
本文提出了一种新颖的方法来近似 DNNs 的全局鲁棒性。该方法在计算上高效、可扩展,并且可以处理各种类型的对抗性攻击和黑盒 DNNs。与现有的近似方法不同,该方法为计算得到的鲁棒性得分提供了统计保证。
2. 相关工作
近年来,测量 DNNs 的局部对抗性鲁棒性受到了广泛关注,主要有以下两种方法:
- 形式验证方法 :利用约束求解和抽象解释技术来确定 DNNs 的鲁棒性。这些方法相当精确,但通常可扩展性有限,并且仅适用于白盒 DNNs。
超级会员免费看
订阅专栏 解锁全文

26

被折叠的 条评论
为什么被折叠?



