一、解决问题
1、以前的一些研究使用不同的数据集进行训练和测试,但训练和测试集中的类之间存在相似性;
例如,在(Dauphin et al.,2013)中,训练集中的“imdb.com”类与测试集中的“movies”类自然对应。
2、针对关于文本分类的ZSL,很少有人研究三类语义知识(semantic attributes 、concept ontology、semantic
word embeddings)中的一种,并且没有人研究将三类语义知识结合来实现零样本学习。
二、主要贡献
1、提出了一种新的基于深度学习的两阶段分类框架,包括粗粒度和细粒度分类,以解决零样本文本分类问题。与以前的一些工作不同,我们的框架不需要在训练阶段的类和推理阶段的类之间进行语义对应。换句话说,可见和不可见的类可以明显不同。
2、提出了一种新的数据增强技术,称为主题翻译(topic translation),以加强我们的框架的能力,以有效地检测来自未知类的文档。
3、提出了一种在零样本场景中,利用集成语义知识将从已知类学习到的知识转移到未知类中进行特征增强的方法。
三、模型框架
图1 :框架概述,分两个阶段。粗粒度阶段判断输入文档xi是否来自可见或未看见的类。细粒度阶段最终决定了类xi。
要求:
(i)每个类都有一个类标签和一个类描述(图2a);
(ii)还提供了一个显示超类与子类关系的类层次结构(图2b);
(iii)在训练框架中没有来自未知类的文档。
图2:a)类标签和类描述(b)类层次结构,(c)一般知识图(conceptnet)的子图
说明:
训练阶段输入的Xi是包含单词序列[Wi1,Wi2,...,WiT]的第