主题特定观点摘要的有效方法
1. 引言
随着Web 2.0的发展,人们热衷于通过在线工具表达个人观点。从健康改革的评论到消费产品特性的评价,大量观点广泛传播。在实际应用中,人们希望依据自身偏好聚焦观点表达的摘要来做决策。例如,用户会提出“关于X的观点有哪些?”这样的查询,其中X既可以是产品的某个特性,也可以是一般领域观点的目标。因此,研究主题特定观点摘要(TOS)以满足用户的个性化偏好具有重要意义。
传统摘要仅关注主题相关性,而TOS需要同时考虑特定主题信息和观点信息。例如,对于关于电脑游戏的查询,传统摘要可能只关注“游戏”“操作”“屏幕”等主题相关信息,而TOS则要考虑像“游戏非常小”这样的观点表达。本文将用户在TOS中的信息需求定义为特定主题观点信息(TOI),即关于用户查询的观点表达。
现有TOS方法存在局限性,要么特定主题信息与相应观点信息不匹配,要么缺乏衡量不同主题相关观点信息的能力,从而严重影响性能。本文采用词对来表示TOI,并提出一种加权方案来衡量词对,然后将词对集成到随机游走模型中进行观点句子排名,并采用最大边际相关性(MMR)方法进行摘要生成。
2. 特定主题观点信息的表示
TOS最早在2008年的文本分析会议(TAC)中提出,目标是从文档集合中提取关于给定查询的观点表达的信息摘要。与传统的特定主题摘要不同,TOS关注特定主题观点信息(TOI),一个观点表达的TOI应包含观点、持有者、目标和极性等属性。
2.1 成对表示
为了表示TOI,我们考虑观点表达的所有属性及其关联。本文使用主题 - 情感词对,该概念最初用于观点检索,以捕捉观点与其对应目标之间的上下文信息。由于大多数观
超级会员免费看
订阅专栏 解锁全文
2259

被折叠的 条评论
为什么被折叠?



