Fast Gradient Sign Attack

最新推荐文章于 2023-11-30 11:30:00 发布

iFlyAI

最新推荐文章于 2023-11-30 11:30:00 发布

阅读量368

点赞数

CC 4.0 BY-SA版权

分类专栏：代码样例深度学习文章标签：机器学习深度学习 MINST数据集

原文链接：https://www.flyai.com/article/artc2d5aeff7778460c86bb7687

深度学习同时被 2 个专栏收录

86 篇文章

订阅专栏

代码样例

11 篇文章

订阅专栏

本文介绍了一种通过向原始数据添加细微噪声来欺骗分类器的方法，使用手写数字MNIST数据集作为案例，展示了如何实现FGSM攻击并测试其效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

主要内容
主要讲述通过对原始数据加入细微的噪声得到一组新数据，在新旧两个数据通过人眼难以辨别的情况下，新数据可以欺骗分类器，从而使分类器做出错误的判断。这种方法可以用来攻击一些分类器，并且是完全可行的。
教程以手写数字MINST数据集为例，展示了这种方法。

首先加载包：

from __future__ import print_function
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms
import numpy as np
import matplotlib.pyplot as plt

加载数据集：

test_loader = torch.utils.data.DataLoader(
datasets.MNIST('../data', train=False, download=True, transform=transforms.Compose([
transforms.ToTensor(),
])),
batch_size=1, shuffle=True)

定义一个网络模型（分类器）：

class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = nn.Conv2d(1, 10, kernel_size=5)
self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
self.conv2_drop = nn.Dropout2d()
self.fc1 = nn.Linear(320, 50)
self.fc2 = nn.Linear(50, 10)

def forward(self, x):
x = F.relu(F.max_pool2d(self.conv1(x), 2))
x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
x = x.view(-1, 320)
x = F.relu(self.fc1(x))
x = F.dropout(x, training=self.training)
x = self.fc2(x)
return F.log_softmax(x, dim=1)

定义其他的参数

device = torch.device("cuda" if (use_cuda and torch.cuda.is_available()) else "cpu")#是否CUDA
epsilons = [0, .05, .1, .15, .2, .25, .3]#
pretrained_model = "data/lenet_mnist_model.pth"#模型的路径

实例化模型

model = Net()#实例化
model=model.to(device)#放入GPU
model.load_state_dict(torch.load(pretrained_model, map_location='cpu'))#将之前训练好的参数加载
model.eval()#转化为测试模式

定义FGSM攻击函数

def fgsm_attack(image, epsilon, data_grad):
#获取梯度的符号
sign_data_grad = data_grad.sign()
#在原始图片的基础上加上epsilon成符号
perturbed_image = image + epsilon*sign_data_grad
#将数值裁剪到0-1的范围内
perturbed_image = torch.clamp(perturbed_image, 0, 1)
return perturbed_image

sign（）函数返回数值的符号，如果为正数返回1，如果为负数返回-1.否则返回0.

测试函数：

def test( model, device, test_loader, epsilon ):
correct = 0#攻击之后预测依然正确的个数
adv_examples = []#受攻击的样本
for data, target in test_loader:
data, target = data.to(device), target.to(device)#将数据加载进GPU
data.requires_grad = True#需要保存梯度
output = model(data)#利用分类器区分结果
init_pred = output.max(1, keepdim=True)[1] #获取最大概率的索引值
if init_pred.item() != target.item():#如果分类错误，则不攻击该样本
continue
loss = F.nll_loss(output, target)#计算损失值
model.zero_grad()
loss.backward()
# 抽取梯度值
data_grad = data.grad.data
#攻击样本
perturbed_data = fgsm_attack(data, epsilon, data_grad)
# 再次分类
output = model(perturbed_data)
final_pred = output.max(1, keepdim=True)[1] # 得到最终分类结果
if final_pred.item() == target.item():#如果最终分类结果和真实结果相同
correct += 1
# 保存epsilon为0
if (epsilon == 0) and (len(adv_examples) < 5):
adv_ex = perturbed_data.squeeze().detach().cpu().numpy()
adv_examples.append( (init_pred.item(), final_pred.item(), adv_ex) )
else:
# 保存其他的一些结果，用于后期的可视化操作
if len(adv_examples) < 5:
adv_ex = perturbed_data.squeeze().detach().cpu().numpy()
adv_examples.append( (init_pred.item(), final_pred.item(), adv_ex) )
#计算准确率
final_acc = correct/float(len(test_loader))
print("Epsilon: {}\tTest Accuracy = {} / {} = {}".format(epsilon, correct, len(test_loader), final_acc))
#返回准确率和攻击样例
return final_acc, adv_examples