企业搜索引擎的全方位解析与应用指南
1. 范围索引与 MarkLogic Server
1.1 范围索引的设置
范围索引通过存储一组有序的值和与之相关的文档列表来设置。例如,通过获取两个日期值之间的文档 ID 块,可确定九月份的所有新闻文章。
1.2 MarkLogic Server 的内存数据操作
MarkLogic Server 的索引会缓存在服务器的内存中,利用可用的空闲内存。这使得对这些数据的操作非常快速。除了范围查询,范围索引还可用于排序和分面导航。
此外,还可以使用范围索引对一组结果中的字段值执行数学函数,常见的计算包括统计提及特定值的文档数量,用于计算分面。其他支持的操作有求和、平均值(均值、众数和中位数)、标准差和方差等。还能使用 C++ 编写用户定义的函数,并在运行时将其插入 MarkLogic Server,以提供自定义的复杂范围数学计算。
范围索引的其他操作还包括计算搜索结果的热图密度,并可将其覆盖在地图上,也能执行共现计算,即查看每个搜索结果中的两个或多个字段的值同时出现的频率,这有助于发现模式,如医疗状况与 Twitter 上提及的产品之间的联系。
1.3 MarkLogic Server 的细粒度结果检索
大多数搜索引擎对整个文档进行搜索查询,而 MarkLogic Server 允许指定文档的子集并进行搜索。这在将搜索限制在特定部分而非整个文档或单个字段时特别有用,例如书籍摘要、文章评论或推文文本(推文实际上有数十个字段,并非只是简短的文本字符串)。
1.4 MarkLogic Server 评估
MarkLogic
超级会员免费看
订阅专栏 解锁全文
452

被折叠的 条评论
为什么被折叠?



