11、基于查询时实体挖掘的网络搜索及专利规范探索

基于查询时实体挖掘的网络搜索及专利规范探索

1. 实体排名方法的用户比较评估

为了评估实体排名方法,邀请了15位年龄在20 - 28岁之间的用户参与,其中男性占比73.3%,女性占比26.6%。选择了20个查询,针对每个查询打印一页,包含三列,分别对应三种排名方法(方程(1)、(2)和(3)),每列展示人员、地点、组织三类别的前10个实体,采用全内容的实体挖掘(NEM)。

要求每个参与者标记出最偏好的排名,如果无法确定最偏好的,也可以将两个甚至三个标记为同等偏好。基于多数排名(仅考虑最偏好的选项)汇总结果,发现方程(1)得到的排名最受青睐,在15×20 = 300个问题中,有228个问题选择了方程(1)得到的排名,方程(2)和(3)的偏好程度相近,分别在43个和44个问题中被选为最偏好选项。

从更详细的数据来看,15位参与者中有13位最偏好方程(1),并且对于所有20个查询,方程(1)也都是最受偏好的。由此可以得出结论,在当前设置下,查询与实体名称之间的字符串相似度并没有改善实体排名。

排名方法 被选为最偏好选项的次数
方程(1) 228
方程(2) 43
方程(3) 44

2. 内容挖掘与片段挖掘的比较 </

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值