信息检索中的模型研究与优化
1. SLDA模型在信息检索中的应用
1.1 不同K值和迭代次数下的AP结果
在信息检索中,SLDA模型的性能会受到不同参数设置的影响。下面是不同K值和迭代次数下在AP上的结果(MAP):
| iterations | K=50 | K=200 | K=1000 |
| — | — | — | — |
| 2 | 0.2460 | 0.2461 | 0.2458 |
| 3 | 0.2467 | 0.2465 | 0.2467 |
| 5 | 0.2442 | 0.2445 | 0.2421 |
| 10 | 0.2398 | 0.2372 | 0.2371 |
| 20 | 0.2327 | 0.2315 | 0.2303 |
| 30 | 0.2307 | 0.2268 | 0.2266 |
| 50 | 0.2261 | 0.2257 | 0.2249 |
从这个表格中,我们可以看出不同的K值和迭代次数组合对MAP结果有不同的影响。随着迭代次数的增加,MAP值总体上呈现出下降的趋势。
1.2 SLDA模型与语言模型的比较
为了更全面地评估SLDA模型的性能,将其(采用查询似然检索方法)与KL散度语言模型(LM)进行了比较。实验分为“Rank”和“Re - rank”两个部分:
- Rank实验 :使用两个模型为每个查询从整个集合中检索排名前1000的文档,并比较它们的检索性能。
- Re - rank实验 :首先使用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



