标题:《Linear Classifier: An Often-Forgotten Baseline for Text Classification》
一、摘要部分
1、如今人们通常直接对如BERT等这样的大规模预训练语言模型进行简单训练并直接部署(因为它们具有卓越的性能)。
2、作者指出,这种方法并不总是(原文是用sometimes)才能获得令人满意的结果。作者认为,预先使用简单基线模型(如线性分类器)可以确认高级模型的结果是否可被接受。(即可用简单基线模型先判断高级模型在某方面运用是否取得最好结果,在去训练高级模型,这可大大节省时间、资金和设备资源)
二、介绍部分
1、作者对于许多实践者直接在文本数据运行具有固定周期数的预训练语言模型不一定都能的到令人满意结果的现象,提出:对于文本分类,应该将诸如线性分类器之类的简单基线与高级模型一起使用,原因如下:
1)训练线性分类器可以为解决某些问题的高级模型提供相当的性能,作者主张使用线性分类器训练的简单一元语法TF-IDF特征作为文本分类器的基线
2)学习方法可以帮助我们检查像BERT这样高级架构训练结果是否合理