信息检索算法实验与中世纪手稿检索策略研究
在信息检索领域,不断有新的算法和策略被提出和研究,以提高检索的准确性和效率。本文将介绍两方面的研究内容,一是关于优化预期互惠排名(ERR)的学习排序算法实验,二是数字化中世纪手写文档的信息检索策略。
优化ERR的学习排序算法实验
在信息检索中,文档的排序至关重要,它直接影响用户获取信息的效率和满意度。为了优化文档排序,研究人员提出了一种名为SVMERR的算法,该算法采用结构支持向量机(SVMs)来优化ERR指标。
- ERR指标与模型计算
- ERR指标考虑了文档i之前的文档对用户选择行为的影响。在定义ERR的损失函数和交换文档产生的变化量后,通过交换文档的方法生成最违反约束的y,然后使用切割平面算法计算排名模型w。最后,模型w对查询q的文档进行评分,并按分数降序排列。
- 实验数据集与方法
- 使用MSRA发布的LETOR3.0中的OHSUMED和TD2003数据集进行实验。这些数据集包含不同数量的查询、相关和不相关文档,并被均匀分为五组进行五次交叉验证。实验将SVMERR算法与回归(点式方法)、排名SVM(成对方法)、SVMMAP、SVMNDCG和ListNet(列表式方法)进行比较。
- OHSUMED数据集实验结果
- 精度曲线 :ListNet算法在P@1和P@3时取得最佳结果,SVMNDCG
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



