2020 arxiv 对比学习+句子表征 结构和SimCLR类似,主要提出了四种数据增强构建负例句子的方法 词汇删除 随机删除一些词汇(删除的次用[del]符号表示) 词段删除 词汇删除的一个特例删除连续的某些词 词序重排 和BART中的句子排序类似,替换句子中某些词对的顺序 同义词替换 随机选择某些词汇并使用同义词进行替换