Elasticsearch 的默认相似度算法是 Okapi BM25,Okapi BM25模型于 1994 年提出,BM25 的 BM 是缩写自 Best Match, 25 是经过 25 次迭代调整之后得出的算法,该模型也是基于 TF/IDF 进化来。
1、原理:
文本相似度 — TF-IDF和BM25算法:https://www.cnblogs.com/jiangxinyang/p/10516302.html
2、代码实现:
文本相似度-bm25算法原理及实现:https://www.jianshu.com/p/1e498888f505
BM25原理与代码实现
最新推荐文章于 2025-05-07 10:19:44 发布