阅读笔记:Adversarial Multi-task Learning for Text Classification [ACL-2017]

【阅读笔记:Adversarial Multi-task Learning for Text Classification】

论文题目:Adversarial Multi-task Learning for Text Classification

作者:Pengfei Liu, Xipeng Qiu and Xuanjing Huang

出处:ACL 2017

论文主要相关:多任务学习、文本分类、情感分析

概要:常规的多任务学习通常单纯的共享某些参数,导致共用特征空间和私有特征空间中存在大量冗余的特征。作者提出了一种对抗性多任务学习框架,缓解了共享特征空间和特定任务特征空间(私有潜在特征空间)之间的相互干扰的问题,并采用对抗学习确保共用特征空间中仅存在共用特征和任务无关的特征,辅以正交约束来去除私有和共用特征空间中冗余的特征。在16个任务的情感分析测试中,该框架比单任务学习平均效果提升了4.1%,比其他多任务学习框架(FS-MTL、 SP-MTL等)效果更好。并且实验结果表明模型的共享特征学习到的知识,容易被迁移到新任务的情感分析中。

一、待解决问题:特征噪声

  1.1 Multi-task Learning
  多任务学习是一种有效的借助其他相关任务的帮助来提升单个任务表现的方法,而基于神经网络的多任务学习模型因为便于结合来自多个任务的信息而在机器视觉和自然语言处理中大受欢迎。->关于多任务学习的回顾
  
  1.2 Problems in existing methods
  现有的方法中,提取的共享(shared)特征容易受到特定任务(task-specific)特征或其他任务带来的噪声污染。

Alt text

  Background:多任务学习中将特征空间划分为两部分,一个用于存储某任务特有的(private 、task-specific、task-dependent )的特征表示,另一个用于捕获与特定任务关联性较低的共享特征表示。
  目前的SP-MTL模型中存在的主要局限在于共享特征表示空间中可能包含一些不必要的任务特有特征表示,而且一些与任务关联性较低的共享特征表示也可能混合在私有特征空间中,这是由特征冗余造成的。
  私有特征表示:任务特定的,独有的的情感特征表示,在具体任务背景中具有独有的情感极性。
  共享特征表示:任务分类之间的泛化边界,应具有较低的任务敏感性,在不同的任务语境中表现出相同或相近的情感极性。
  
   1.3 Give an example
  使用传统多任务学习模型输入以上两个句子(电影评论与婴儿用品评论),进行情感特征分类学习。
Alt text

  使用传统多任务学习模型输入以上两个句子(电影评论与婴儿用品评论),进行情感特征分类学习。
   一词多义问题:“infantile”一词在电影任务中表示消极情绪,而在婴儿任务中则是中性的。使用传统的SP-MTL进行特征提取之后,在共享层与电影任务的特定特征表示层中都存放了“infantile”一词,这就对后续的情感分析造成潜在的不确定影响。
  同时,共享空间的容量也可能被一些不必要的特性所浪费。

  1.4 Neural network models

Alt text

  目前主要有四种用于MTL的神经网络模型,本文使用Long Short-term Memory(LSTM)模型进行文本分类,关于LSTM模型可见 【Deep Learning】LSTM(Long Short-Term Memory)及变体。对于一个给定的句子 x=x1,x2,···,xT x = x 1 , x 2 , · · · , x T ,首先通过lookup层获取到每个词的向量表示,然后通过LSTM,使用最后一个时间步的输出 hT h T 作用整个句子的表示,最后通过一个softmax层进行分类,得到相应类别的概率。

ŷ =softmax(WhT+b) y ^ = s o f t m a x ( W h T + b )   (5)

  其中y′表示通过softmax层输出的预测分类概率(向量),W表示通过训练得到的权重向量,b为偏置项;

  对于含有N个训练样本的数据集( xi,yi x i , y i ),对网络参数进行训练,从而使预测分布与真实分布的交叉熵达到最小。

L(ŷ ,y)=Ni1Cj=1yiIlog(yji) L ( y ^ , y ) = − ∑ i − 1 N ∑ j = 1 C y I i l o g ( y i ′ j )   (6)

   yji y i j 表示真实的类别标签, ŷ ji
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值