对“基于语义依存的汉语句子相似度计算”的优化。

本文探讨了基于依存结构的句子相似度计算方法,提出了两种优化策略:一是通过比较依赖树节点的重复率来增强相似度计算;二是扩展核心词至全句动词和名词,以更全面地反映句子结构和语义。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景

原文[1]在利用依存结构进行相似度计算时,只考虑那些有效搭配对之间的相似度。有效搭配对是指全句核心词和直接依赖于它的有效词组成的搭配对。

优化策略1

可以比较依赖树中节点的重复率,重复率可以作为相似度的权重之一。 

其中:ComCount:为两棵树都有的节点个数。PairCount1为句子1的节点个数,PairCount2为句子2的节点个数。

优化策略2

依存结构中的有效搭配,在原有的基础上,加上句子中所有动词或名词,和直接依赖于它的有效词组成的搭配对。

原因:对于稍长的句子,句法分析的依存树就相对发杂,单纯的核心词和直接依赖于它的有效词组成的搭配对,不足以代表句子的结构,将核心词扩大到全句的所有动词和名词,则更能代表全句的语义,以及结构。

注:核心词个人理解为依存树的头结点,如果由于个人理解错误,则策略2不一定成立。

 参考目录:

1基于语义依存的汉语句子相似度计算。  http://ir.hit.edu.cn/phpwebsite/index.php?module=pagemaster&PAGE_user_op=view_page&PAGE_id=214

 

转载于:https://www.cnblogs.com/bent/archive/2011/11/01/2232083.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值