文档搜索与内容分析:技术原理、实践操作与深入探索
1. 跨语言搜索与文档搜索基础
跨语言搜索策略与执行搜索的文档集合属于同一领域,可用平行数据集与特定跨语言任务之间的领域关联性对任务的最终性能起着决定性作用。在文档搜索方面,主要从向量空间模型的角度介绍了一些基础概念。
向量空间模型在信息检索中具有重要地位,其基础由Jones(1972)和Salton等人(1975)奠定。概率相关性框架由Robertson和Jones(1976)引入,在此基础上发展出了其他概率模型,如二元独立模型(Yu和Salton,1976)和BM25(Robertson等人,1994)。
| 模型/框架 | 提出者 | 提出时间 |
|---|---|---|
| 向量空间模型 | Jones、Salton等人 | 1972年、1975年 |
| 概率相关性框架 | Robertson和Jones | 1976年 |
| 二元独立模型 | Yu和Salton | 1976年 |
| BM25 | Robertson等人 | 1994年 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



