《Opinion Word Expansion and Target Extraction through Double Propagation》论文笔记

一、摘要

  1. 本文旨在于解决两方面的问题。
    • opinion lexicon expansion(意见词典扩展)
    • opinion target extraction (意见目标扩展)
  2. 为了解决上面两方面的问题,通过使用依赖解析器去扩展意见字典和挖掘目标,使得opinion words和targets建立联系。
  3. 作者使用双向循环的方法来使用信息在opinion words和target之间不断传播。这种方法的好处就是只需要一个初始的opinion字典即可。

二、介绍

  1. opinion lexicon就是包含许多的opinion 单词,例如good, excellent, poor 和 bad。但是使用opinion字典的缺陷就在于不可能去囊括所有的意见和领域。并且一个词可能在这个领域是positive,在另一个领域可能就是neural了。
  2. Opinion targets代表被opinion表述的对象。例如I am not happy with the battery life of this phone,电池的寿命就是opinion target。
  3. 作者提出的方法:从已知和被提取的(在之间的迭代)的opinion words和targets中,通过识别语义上的联系,迭代提取opinion words和targets。这种使得信息在opinion和target之间来回流动的方法称为double propagation。

三、Relation Identification(关系识别)

  1. 意见词典扩展的关键就在于识别opinion word-target (OT-Rel)、target-target(TT-Rel)、opinion word-opinion word(OO-Rel) 之间的关系

  2. 直接依赖:A和B直接关联、A和B通过H直接关联。

  3. 间接依赖:A通过H1依赖于B、A和B分别通过H1和H2依赖于H

  4. 为了方便后面的依赖解析器,还引入了序列标注任务。一般opinion words多为形容词、targets一般为单个名词或名词短语。

四、Opinion Lexicon Expansion and Target Extraction

  1. 扩展方法是基于预先定义好的规则。例如:一个opinion word通过人直接依赖的名词被作为宾语等等。
  2. 主要思想:首先通过初始的opinion lexicon去句子中识别opinion words,然后通过句法关系,进一步识别出其他opinion words或者target,然后将他们加入到lexicon。再不断迭代上面的过程,直到没有新的opinion words和targets能够被识别出来。

五、Propagation Rules Defined Based on Relations

  1. 在进行传播的过程中会有下面4个子任务:

    • extracting targets using opinion words
    • extracting targets using the extracted targets
    • extracting opinion words using the extracted targets
    • extracting opinion words using both the given and the extracted opinion words
  2. 举个例子,对于句子“Canon G3 takes great pictures, The picture is amazing, You may have to get more storage to store high quality pictures and recorded movies,and The software is amazing”。我们的opinion lexicon里面只有一个单词“great”。

    • 根据great,通过句法关系,我们可以识别出picture(target)。
    • 然后通过picture,通过句法关系,我们可以在第二句话中识别出amazing。
    • 通过piciture还可以识别出movies。
    • 通过amazing我们又可以识别出software。

六、Opinion Word Polarity Assignment

  1. 关于opinion words和targets,作者观察到几个方面:
    • 在一个评论中,对于相同的target,情感极性一般是相同的。
    • 在一个领域库中,相同观点词具有相同极性。
  2. 基于观察到的两方面,建立下面几条判断情感极性的规则。
    • 对于由已知target提取的opinion words和由已知opinion words提取的target,我们赋予它们与已知相同的极性。
    • 对于由已知opinion words提取的opinion words和由已知target提取的target,我们赋予它们与已知相同的极性。除非句子中出现相反的话语。

七、总结

本文是在2011年发表的ACL论文,时间比较久了。提出的思想是通过初始化一个小的opinion字典,然后通过句法规则去实现double propagation,从而实现opinon lexicion和target(aspect)lexicon的扩展,最后再通过一些预定义的规则去进行分类。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值