主题特定观点摘要与人物姓名多极化分析
在信息爆炸的时代,如何从大量文本中提取有价值的信息成为了重要的研究课题。本文将介绍主题特定观点摘要(TOS)和主题人物姓名多极化的相关方法和实验。
主题特定观点摘要(TOS)
- 句子相似度计算 :定义了相似度函数
sim来衡量两个句子或摘录节点之间的相似度,基于它们包含的词对。公式如下: - (sim(s_u, s_v)=\frac{\sum_{p_{ij}\in s_u, s_v}w_{p_{ij}}^{s_u}\cdot w_{p_{ij}}^{s_v}}{\sqrt{\sum_{p_{ij}\in s_u}(w_{p_{ij}}^{s_u})^2}\times\sqrt{\sum_{p_{ij}\in s_v}(w_{p_{ij}}^{s_v})^2}})
- 句子 (s_u) 的显著性得分
Score(s_u)通过混合查询相似度得分和与其相连的所有其他句子的得分来计算:- (Score(s_u)=\gamma\sum_{v\neq u}Score(s_v)\cdot P(s_u|s_v)+(1 - \gamma)sim’(s_u|Q))
- 其中 (sim’(s_u|Q)=\frac{sim(s_u|Q)}{\sum_{k = 1}^{N}sim(s_k|Q)})
- (sim(s_u|Q)=\frac{\sum_{w_{t_i}\in s_u,Q}w_{t_i}^{s_u}\cdot w_{t_i}^{Q}}{\sqrt{\
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



