- 博客(2)
- 收藏
- 关注
原创 lucene打分公式
lucene利用余弦相似度进行计算,并进行了改进 coord(q,d):文档d匹配q的词越多,此值越大,在查询的时候计算的,匹配的词/查询的总词数(可能不一样) queryNorm(q):是一个归一化的因子,使得两个分数之间可以比较,默认计算公式如下: tf(tin d):和词频相关,t出现在d中的词数,tf(t in q)是1,因为如果一个查询q包含两个相同的t,在公式中会计算
2017-02-27 18:04:46
477
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人