文献记录－ADVERSARIAL TRAINING METHODS FOR SEMI-SUPERVISED TEXT CLASSIFICATION

最新推荐文章于 2024-11-15 22:10:05 发布

wenqiang su

最新推荐文章于 2024-11-15 22:10:05 发布

阅读量1.1k

点赞数

分类专栏：文献记录

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42681868/article/details/106944500

版权

文献记录专栏收录该内容

7 篇文章

订阅专栏

文献地址：

https://arxiv.org/pdf/1605.07725.pdf

摘要：

＂对抗训练＂提供了一种正则化的监督学习算法．
＂虚拟对抗训练＂能够将监督学习算法拓展到半监督学习的环境中．
两者都是对输入向量进行较小的扰动，不适用于稀疏高维的输入向量．
从而提升泛化能力．

简介：

先前的对抗训练主要应用与图像分类，本文中要拓展到文本分类任务和序列模型．
本文的对抗训练就是对输入相连进行小的修改．

模型：

在这里插入图片描述如上图左边是一个常规的双向LSTM,输入的稀疏向量w 被转化为连续向量v时候，输入到ＬＳＴＭ模型中，然后用模型的输出做文本分类，而右图则是对抗生成网络的输入．
其中输入相连Ｖ需要归一化之后在加扰动项，归一化的公式如下：
在这里插入图片描述

对抗和虚拟对抗训练：

对抗训练：

将Θ作为参数，ｘ作为输入，损失函数如下：
在这里插入图片描述
其中ｒ是输入的扰动．
r(adv) 是固定Θ的情况下（为了反向传播时不会通过这里），最小化p（ｙ|x+r）概率时的ｒ值．
即给一个扰动使得结果最差
然后用训练的原始数据去加上这个扰动，并调整参数Θ（从而提升模型的鲁棒性）

虚拟对抗训练：

损失函数如下：
在这里插入图片描述
ＫＬ散度是计算两个分布的差异，如上图公式，先找出固定参数Θ时差异最大的扰动项，然后去更新Θ以最小化这个加了扰动项的特征相连和原始特征相连的差异．是分类器对当前（此时的Θ决定的模型）最敏感的方向上具有抗干扰性．
这种虚拟对抗训练的方式不需要真实的label，这使得其可以应用到半监督学习上去．

本文对抗训练：

在本文中需要把输入的向量做归一化处理并定义为ｓ，模型的条件概率就是p(y|s;Θ)，Θ是模型参数．
定义扰动项r(adv)如下：
在这里插入图片描述

对抗部分的损失为每个样本损失的平均值：
在这里插入图片描述

本文虚拟对抗训练：

虚拟对抗模型的扰动项：
在这里插入图片描述

虚拟对抗部分的损失函数：
在这里插入图片描述

实验设计：

LSTM + ADV

结果：

在这里插入图片描述ｅ=5.0

从上图看到对抗网络具有较好的鲁棒性，对最终的性能可能带来２－３％的提升（收敛速度很慢）

在这里插入图片描述
上图所示，虚拟对抗训练的损失最小

在这里插入图片描述上图是和＂ｇｏｏｄ＂和＂ｂａｄ＂最接近的词语（余弦最小）
可以看到"good"和"bad"有着相似的语法作用（都是修饰某个东西），但是其含义是不同的．
而对抗训练就能区分开这种语法上相似，但含以上不相似的特征

博客等级

码龄7年

74
原创

18
点赞

118
收藏

12
粉丝

关注

私信

热门文章

分类专栏

English
报错记录 1篇
文献记录 7篇
数据结构 1篇
比赛 4篇
Tensorflow2.0 11篇
前端 2篇
Pytorch 18篇
Paddle 7篇
数据库 2篇
spider 1篇
机器学习 11篇
深度学习 4篇
java 3篇
python 3篇
爬虫 2篇
大数据 3篇
数据分析 1篇
scala

展开全部收起

上一篇：: 文献记录－RoBERTa: A Robustly Optimized BERT Pretraining Approach

下一篇：: 读书笔记-统计学习方法（李航）第八章

最新评论

pytorch-transformers （BERT）微调
lyn_CS: 直接torch.save(model, PATH)，下次调用时直接model = torch.load(PATH)
pytorch-transformers （BERT）微调
lyn_CS: 你看一下transformers的文档，里面有说到怎么保存和加载模型。训练好的模型保存起来，就可以直接用 # Saving best-practices: if you use defaults names for the model, you can reload it using from_pretrained() if args.do_train and (args.local_rank == -1 or torch.distributed.get_rank() == 0): # Create output directory if needed if not os.path.exists(args.output_dir) and args.local_rank in [-1, 0]: os.makedirs(args.output_dir) logger.info("Saving model checkpoint to %s", args.output_dir) # Save a trained model, configuration and tokenizer using `save_pretrained()`. # They can then be reloaded using `from_pretrained()` model_to_save = model.module if hasattr(model, 'module') else model # Take care of distributed/parallel training model_to_save.save_pretrained(args.output_dir) tokenizer.save_pretrained(args.output_dir) # Good practice: save your training arguments together with the trained model torch.save(args, os.path.join(args.output_dir, 'training_args.bin'))
pytorch-transformers （BERT）微调
书屋里的咸鱼: 请问您知道训练完成后的bert怎么保存以用于其他的下游任务吗？
pytorch学习笔记-入门-定义网络
Tisfy: 深得人心，正如古人云：欲买桂花同载酒，终不是、少年游。
TF2-Wide&Deep-subclass
程序猿学长: 感谢分享

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。