Is BERT Really Robust? A Strong Baseline for Natural Language Attack on Text Classification

weixin_45674607

已于 2022-04-04 08:49:14 修改

阅读量733

点赞数

分类专栏：论文阅读文章标签：经验分享

于 2022-04-03 16:27:20 首次发布

版权

4 篇文章

订阅专栏

Is BERT Really Robust? A Strong Baseline for Natural Language Attack on Text Classification and Entailment

# 目前是第一次去粗略的阅读论文，在后面回去复现算法，到时候在去做详细的补充

现状
机器学习模型的性能会受到困难样本的影响，困难样本可以用来评价和改善模型的健壮性。
观点
提出了一种名为TEXTFOOLER，简单且强大的基准来产生困难样本。应用这种算法在自然语言任务（文本分类和文本蕴含）。用于测试的模型包括BERT、卷积神经网络和循环神经网络。最终论证得到这个算法的三个优点：1.有效性 2.高效性（计算的复杂性与文本的长度成正相关） 3.实用的保留（它保留语义内容，语法和正确的人为分类类型）。

困难样本的现状
早些时候使用的产生对抗性样本的方法
1. word misspelling
2. single-word
3. phrase inaertion and removal
存在的问题无法满足三个关键的实用保留的特性同时无法对BERT模型产生影响
1. 人为预测的一致性
2. 语义的相似性
3. 语言的流畅度
该算法产生的样本
可以使目标模型在原始词汇的混乱度少于20%的情况下，准确率下降10%。
同时满足上面三个对抗性文本的特性。
该论文的贡献
1. 在这种黑盒测试中使目标模型受到攻击。
2. 它提高了三种深度学习模型的成功率和扰动率。
3. 他提出了一种评价该框架的评价体系。
4. 开放我们的模型，代码和测试样本。