对抗样本(相关知识整理)

最新推荐文章于 2024-03-12 21:03:59 发布

Enjoy_endless

最新推荐文章于 2024-03-12 21:03:59 发布

阅读量6.4k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Deep learning Machine learning 对抗样本

本文链接：https://blog.youkuaiyun.com/Enjoy_endless/article/details/90700070

最近在学习接触一些对抗样本的相关知识、论文，整理分享如下。
(未完待续)

1.什么是对抗样本：

在原有真实样本的基础上稍加处理，使原有分类器对其真实类别无法判别；
（比如带了一个面具之后你不认识我了，或者说是批了一个羊皮，你就识别不出来我是一个人了。）
在这里插入图片描述

2.对抗样本有什么用：

对于人脸识别，我带上一个特制眼镜就识别不出来我是谁了；
对于安保摄像识别人的系统，我穿了一个特制衬衫，摄像头就识别不出来我是一个人了。
路标指示牌上我贴了一个贴纸之后，自动驾驶就识别指示牌识别错误了。

3.如何生成对抗样本：

(注意，模型对于图像彩色、灰度、尺寸、压缩、模糊等是具有鲁棒性的)
基本原理就是对于原样本像素值的一个扰动。
在这里插入图片描述
1）测试集角度上样本处理

1、基于像素值的变化

1）FGSM(Fast Gradient Sign Method):

扰动值：设置为模型损失梯度的sign函数，

在经典的FGSM算法中，根据相应的代价梯度方向(符号)对所有的输入像素进行相同程度的正负变化；(我们发现仅仅利用梯度最低和最高的部分像素值同样可以产生有效的对抗样本)

2）DeepFool
扰动处理，直到分类错误(达到目的)，停止扰动(计算了到达决策边界的xi的扰动向量，并更新

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Enjoy_endless

关注关注

1
点赞
踩
27

收藏

觉得还不错? 一键收藏
6
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

对抗样本检测：10种有效方法对比分析

AIGC应用创新大全的博客

06-06

923

本文旨在为机器学习从业者提供对抗样本检测的系统性指南，涵盖从基础概念到前沿技术的完整知识体系。我们重点分析10种具有代表性的检测方法，讨论它们的理论基础、实现细节和适用场景。文章首先介绍对抗样本的基本概念，然后详细分析10种检测方法，接着通过实验对比它们的性能，最后讨论实际应用建议和未来趋势。对抗样本(Adversarial Example)：经过精心设计的输入数据，能够欺骗机器学习模型产生错误输出对抗攻击(Adversarial Attack)：生成对抗样本的过程和技术。

对抗样本（对抗攻击）入门

一个平平无奇的甜妹

12-03

1万+

什么是对抗样本？从2013年开始，深度学习模型在多种应用上已经能达到甚至超过人类水平，比如人脸识别，物体识别，手写文字识别等等。在之前，机器在这些项目的准确率很低，如果机器识别出错了，没人会觉得奇怪。但是现在，深度学习算法的效果好了起来，去研究算法犯的那些不寻常的错误变得有价值起来。其中一种错误叫对抗样本（adversarial examples）。 对抗样本（Adversarial...

6 条评论您还未登录，请先登录后发表或查看评论

对抗样本：知其然，知其所以然

nemo的博客

07-15

2万+

聪明汉斯的故事在二十世纪初的德国，有一匹名叫汉斯的马非常有名。在主人威廉•冯•奥斯滕的训练下，聪明的汉斯经过了一段时间的训练，掌握了简单的数学运算。当奥斯滕问汉斯“一加一等于几”的时候，它会用蹄子在地上“嗒，嗒，嗒”的敲出答案。围观的群众看到汉斯能够正确的回答各种数学题，都感到惊讶和神奇。同时，人们也疑惑，汉斯是否真的通过训练学会了过去人们认为动物做不到的事情。在一系列的调查中，人们发现，如果...

对抗样本简介

ywm_up

07-14

1万+

一、什么是对抗样本 对抗样本是一类被恶意设计来攻击机器学习模型的样本。它们与真实样本的区别几乎无法用肉眼分辨，但是却会导致模型进行错误的判断。对抗样本的存在会使得深度学习在安全敏感性领域的应用收到威胁。如下图所示，通过在自然图片上加入一些人工噪声来“欺骗”神经网络，使得神经网络输出错误的预测结果。以经典的二分类问题为例，机器学习模型通过在样本上训练，学习出一个分割平面，在分割平面的一侧的点都被识别为类别一，在分割平面的另外一侧的点都被识别为类别二。生成攻击样本时，我们通过某种算法，针对指定

对抗样本和对抗网络

Just for fun的专栏

08-24

688

对抗样本和对抗网络所谓对抗样本是指将实际样本略加扰动而构造出的合成样本，对该样本，分类器非常容易将其类别判错，这意味着光滑性假设(相似的样本应该以很高的概率被判为同一类别)某种程度上被推翻了。 Intriguing properties of neural networks, by Christian Szegedy at Google, et al，2014. 这篇论文应该是最早提出对抗

对抗样本的定义

欢迎来到道的世界

05-09

627

对抗样本主要是特指能攻击深度神经网络模型并且人眼不可察觉的恶意样本，以下为各个论文中对其的定义。 Adversarial examples are a type of attack on machine learning (ML) systems which cause misclassification of inputs. 《Adversarial Examples and Metrics》 An adversarial sample is an input crafted to cause dee

FGPM：文本对抗样本生成新方法

Paper weekly

09-25

3566

©PaperWeekly 原创 ·作者｜孙裕道学校｜北京邮电大学博士生研究方向｜GAN图像生成、情绪对抗样本生成论文标题：Fast Gradient Projection Method...

论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习

开放知识图谱

04-19

2516

论文笔记整理：耿玉霞，浙江大学直博生。研究方向：知识图谱，零样本学习等。来源：AAAI2020论文链接：https://arxiv.org/pdf/2001.02332.pdf本文...

少样本知识图谱补全技术研究概述（新模型会持续更新，可以偶尔来看，等我读文献的）

qq_45444343的博客

03-12

3786

少样本知识图谱补全（FKGC）是目前知识图谱补全任务的一个研究热点，旨在拥有少量样本数据的情况下，完成知识图谱补全任务。该任务在实际应用和知识图谱领域都有着重要的研究意义,为了进一步促进FKGC领域的发展，对目前各类方法进行了全面总结和分析。

复旦大学李林阳：应用预训练模型实现对抗样本生成的高效方法

AITIME_HY的博客

11-25

2427

⬆⬆⬆ 点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入！针对离散数据（例如文本）的对抗攻击比连续数据（例如图像）更具挑战性，因为很难使用基于梯度的方法...

对抗样本

这些个事儿

03-28

854

https://yq.aliyun.com/articles/149583?utm_content=m_27089

对抗样本攻击

Michale_L的博客

05-31

5240

AI安全：对抗样本攻击

对抗样本Adversarial Examples

wangsanNOLOVE的博客

11-19

236

# 对抗样本Adversarial Examples

对抗样本——FGSM

NYW007的博客

10-22

1371

Fast Gradient Sign Attack（FGSM）算法小结一、什么是对抗样本？ 对抗样本的概念最早提出于2014年Szegedy的论文 Intriguing Properties of Neural Networks. 在论文，作者发现了一种有趣的现象，即：当前流行的机器学习模型包括神经网络会容易以很高的置信度分错和原始样本仅仅有轻微不同的样本，这类样本被称为对抗样本。这一现象揭示了...

对抗样本（三）FGSM

白丁的博客

03-06

3489

对抗样本与对抗训练

最新发布

03-28

<think>嗯，用户问的是小样本学习是否需要预训练，以及不需要预训练的实现方式和理论依据。首先，我需要回顾一下小样本学习的定义和常见方法。小样本学习（Few-Shot Learning）旨在通过极少量标注数据快速适应新任务，这在数据稀缺的场景下非常重要。用户特别提到“不需要预训练”的情况，所以我得先区分哪些方法依赖预训练模型，哪些不依赖。传统的小样本学习方法比如基于度量学习、数据增强、元学习（Meta-Learning）可能不需要预训练，或者至少不依赖于大规模预训练模型。例如，元学习中的MAML（Model-Agnostic Meta-Learning）通过训练模型在多个任务上快速适应新任务，而无需预训练。这时候的理论依据可能是元学习在任务分布上的优化，让模型具备快速泛化的能力。另外，基于度量学习的方法，比如Prototypical Networks，通过将样本映射到嵌入空间，计算类别原型进行分类。这种方法通常从头训练，不需要预训练，其理论依据是相似性度量和嵌入空间的有效构建。还有基于数据增强的方法，比如通过生成对抗网络（GAN）生成更多样本，或者使用传统的图像变换来扩充数据，这样即使没有预训练，也能提升模型在小样本情况下的表现。理论依据可能在于数据分布的假设，通过增强数据来覆盖更多的变化，减少过拟合。不过，用户提供的引用中有提到预训练的特点，比如引用[4]提到预训练通常是无监督的，使用Transformer架构，这可能与小样本学习结合的情况相关。但用户的问题是关于不需要预训练的方法，所以需要排除这些部分，专注于传统方法。另外，引用[2]提到小样本学习和零样本学习的结合，以及弱监督学习的发展方向，这可能涉及到不需要预训练的多任务学习或迁移学习。例如，零-小样本学习可能利用其他形式的监督信息，如属性或语义描述，而不是依赖预训练模型。然后，需要整理这些方法的实现方式和理论依据，确保每个点都有文献支持。例如，元学习的理论依据是优化模型在任务分布上的初始参数，使其能够通过少量梯度步骤适应新任务；度量学习则是基于同类样本在嵌入空间中更接近的假设。可能还需要考虑这些方法的优缺点，比如元学习需要大量的训练任务，而数据增强可能受限于生成样本的质量。同时，实验对比，如引用[3]提到小样本微调优于从零训练，但用户的问题是不需要预训练的情况，所以需要强调那些不依赖预训练的方法的有效性。最后，确保回答结构清晰，分点说明方法、实现和理论依据，并引用提供的参考文献来支持观点。例如，在元学习部分引用[1]和[2]，在度量学习部分引用[5]中的方法，如DeIL可能涉及不同的学习策略。</think>### 小样本学习不需要预训练的实现方式及理论依据小样本学习（Few-Shot Learning）的目标是通过少量标注数据快速适应新任务，其实现方式**不一定需要预训练**。以下是无需预训练的典型方法及其理论依据： --- #### 一、基于元学习（Meta-Learning）的方法 **实现方式**：元学习通过模拟多任务学习场景，训练模型在多个任务上快速泛化。例如，模型无关元学习（MAML）通过优化模型参数的初始值，使得其能通过少量梯度更新适应新任务。 **代码示例**： ```python # MAML 的简化实现（基于 PyTorch） def maml_update(model, loss_fn, tasks, inner_lr, outer_lr): for task in tasks: # 内循环：任务内快速适应 adapted_model = copy.deepcopy(model) loss = loss_fn(adapted_model(task.support_data)) gradients = torch.autograd.grad(loss, adapted_model.parameters()) # 更新模型参数 for param, grad in zip(adapted_model.parameters(), gradients): param = param - inner_lr * grad # 外循环：优化初始参数 outer_loss = loss_fn(adapted_model(task.query_data)) outer_loss.backward() optimizer.step() ``` **理论依据**：元学习的核心是“学会学习”，即通过任务分布的统计规律优化模型初始参数，使其具备对新任务的快速适应能力[^1][^2]。 --- #### 二、基于度量学习（Metric Learning）的方法 **实现方式**：通过构建样本间的相似性度量，直接在小样本场景中分类。例如，原型网络（Prototypical Networks）为每个类别计算原型（类中心），通过距离度量进行分类。 **数学表达**： $$ c_k = \frac{1}{|S_k|} \sum_{(x_i, y_i) \in S_k} f_\theta(x_i) $$ 其中 $S_k$ 是支持集中第 $k$ 类的样本，$f_\theta$ 是嵌入函数。新样本的预测基于其与各类原型的距离。 **理论依据**：假设同类样本在嵌入空间中聚集，跨类样本距离较远。这种方法无需预训练，直接优化嵌入函数[^5]。 --- #### 三、基于数据增强的方法 **实现方式**：通过生成新样本或变换现有样本扩展训练数据。例如，使用图像旋转、裁剪或生成对抗网络（GAN）生成合成数据。 **理论依据**：数据增强通过引入先验知识（如图像平移不变性）扩充数据分布，缓解过拟合问题。例如，通过几何变换增强图像数据，可提升模型对局部变化的鲁棒性[^2][^3]。 --- #### 四、基于贝叶斯推断的方法 **实现方式**：利用贝叶斯框架建模参数的不确定性。例如，高斯过程（Gaussian Process）或概率图模型，通过少量样本更新先验分布。 **数学表达**： $$ P(\theta|D) \propto P(D|\theta)P(\theta) $$ 其中 $D$ 是小样本数据，$\theta$ 是模型参数。 **理论依据**：贝叶斯方法通过先验分布引入领域知识，结合小样本数据更新后验分布，降低对预训练的依赖[^2]。 --- ### 理论总结无需预训练的小样本学习方法依赖于以下核心思想： 1. **任务分布的归纳偏置**：通过元学习或贝叶斯方法，模型从任务分布中学习通用优化策略。 2. **先验知识注入**：数据增强或度量学习显式引入领域知识（如数据变换规则或相似性度量）。 3. **嵌入空间优化**：直接训练模型将样本映射到可分性强的低维空间，而非依赖预训练特征[^5]。 ---