NLP CH8 属性级情感分析复习

1. 任务定义与形式化

属性级情感分类的目标是:

  • 对文本中的目标实体(entity)及其属性(aspect)进行情感分析。
  • 其形式化定义为五元组 (e, a, s, h, t)
    • e:被评价的目标实体。
    • a:目标实体中的某个属性。
    • s:对实体属性的情感倾向(正、负、中立或打分)。
    • h:观点持有者。
    • t:发表观点的时间。
      image.png
      image.png
  1. 属性抽取(Aspect Extraction,AE):从文本中识别出所有属性。
  2. 属性级情感分类(Aspect-Level Sentiment Classification, ALSC):判断每个属性的情感倾向。

此外,还有扩展任务:

  • 观点抽取(Opinion Extraction,OE):从文本中提取与属性相关的观点词。
  • 三元组联合抽取:同时完成AE、OE和情感分类。
  • 属性-观点联合抽取(Pair Extraction):抽取成对的属性和观点词。

2. 方法

在属性级情感分类中,以下方法被提到:

(1) 属性抽取(AE)
  • Seq2Seq模型:采用GRU门控单元,结合位置感知的注意力机制。
  • 序列标注方法:使用BIO标注体系对属性进行标注。
    image.png
(2) 属性级情感分类(ALSC)
  • 基于注意力的LSTM(ATAE-LSTM)
    • 在句子中针对不同属性动态调整注意力的关注点。
    • 属性信息可以拼接到LSTM的输入层或隐层中。
  • TC-LSTM模型:结合上下文和属性信息进行分类。
    image.png
(3) 属性导向的观点抽取(AOE)
  • 使用Encoder-Decoder框架。
  • 结合内向LSTM和外向LSTM,获取目标和上下文的全局信息。
    image.png
(4) 属性抽取+情感分类(AESC)
  • Pipeline模型:通过先抽取后分类的框架实现,基于BERT的双向编码器。
  • 预测属性的开始位置和结束位置后,直接对属性进行情感分类。
    image.png
(5) 属性观点联合抽取(Pair Extraction)
  • SpanMIT模型:基于多任务学习,结合BERT/BiLSTM对可能的跨度进行枚举和监督,提取属性-观点对。
    image.png
(6) 三元组联合抽取
  • 基于BERT的Span模型:在一个框架中处理所有ABSA子任务(AE、OE和情感分类),通过检测句子中各个组件的位置和类别来完成任务。
  • 统一生成框架(Unified Generative Framework):基于BART模型,将所有ABSA任务统一为概率计算问题。
    image.png
    image.png
(7) 基于大模型的方法
  • Counterfactual数据增强:生成反事实样本(例如将“Never bad”与“positive”虚假关联打破)来提升模型鲁棒性。
  • Instruction Tuning:通过检索示例和语言模型推理相结合进行任务优化。
    image.png
    image.png
    image.png

3. 总结与未来方向

属性级情感分类的未来研究方向包括:

  • 复杂属性的多元组抽取
  • 联合学习(同时抽取和分类)
  • 引入外部知识(语义、词典、常识等)
  • 表示学习(基于Transformer、图神经网络GNN等)

这些方法和技术的目标是提升情感分析的精度与鲁棒性,同时应对更复杂的情感分析场景。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值