本文是复旦大学在第56届ACL会议上发表的文章。主要目的是通过原域大量带有标签的数据及目标域少量带有标签的数据的训练,对目标域大量无标签数据进行分类。
摘要:
现有的跨领域情感分类大多集中在提取域不变的特征,而域特定信息对于情感分类也是十分重要的,因此本文提出一种方法,同时抽取原域和目标域的域特定、域不变信息,然后利用原域和目标域的域不变信息训练一个域不变分类器,利用目标域的域特定信息训练一个域特定信息,然后将这两个分类器进行联合训练,实验表明本文提出的方法与现在最先进的方法相比具有更好的表现。(下图中重叠部分为域不变信息,其余部分为特定信息)
方法:
表示大量带标签的原域数据,
表示少量带标签的目标域数据,
表示大量不带标签的目标域数据。目标是通过
和
建立一个分类器对