验证神经网络免受后门攻击
1. 实现与评估
1.1 实现环境
将验证方法实现为 Socrates 框架中的一个独立分析引擎。使用 Gurobi 求解约束条件,使用 scipy 解决优化问题。
1.2 数据集与网络选择
收集了 51 个神经网络,具体情况如下:
- 45 个全连接网络,在 MNIST 训练集上训练,隐藏层数量为 3 - 5 层,每层神经元数量为 10、20、30、40 或 50。其中,ReLU、Sigmoid 和 Tanh 激活函数各用于 15 个网络。
- 3 个较大的全连接网络,采用 ReLU 激活函数。
- 3 个卷积网络,常用于人脸识别系统,结构相同但训练方式不同,分别为正常训练、使用 DiffAI 训练和使用投影梯度下降训练。
网络命名规则为:f k n,其中 f 是激活函数名称,k 是隐藏层数量,n 是每层神经元数量。卷积网络命名为 conv、conv diffai 和 conv pgd。
所有网络使用干净数据训练,除 Sigmoid 4 10 和 Sigmoid 5 10 精度分别为 81% 和 89% 外,其他网络精度至少为 90%。实验在 3.1Ghz 16 核 CPU 和 64GB RAM 的机器上进行。
1.3 研究问题及实验
1.3.1 RQ1:verifyX 实现是否有效?
为每个网络选择测试集中的前 100 张图像,应用 verifyX 算法对每个标签(0 - 9)进行验证,共 510 个验证任务。每个网络并行运行 10 个进程,ReLU 3 1024 网络因复杂度高,仅运行
超级会员免费看
订阅专栏 解锁全文
44

被折叠的 条评论
为什么被折叠?



