33、企业搜索引擎的全方位解析与应用指南

企业搜索引擎的全方位解析与应用指南

1. 范围索引与 MarkLogic Server

1.1 范围索引的设置

范围索引通过存储一组有序的值和与之相关的文档列表来设置。例如,通过获取两个日期值之间的文档 ID 块,可确定九月份的所有新闻文章。

1.2 MarkLogic Server 的内存数据操作

MarkLogic Server 的索引会缓存在服务器的内存中,利用可用的空闲内存。这使得对这些数据的操作非常快速。除了范围查询,范围索引还可用于排序和分面导航。
此外,还可以使用范围索引对一组结果中的字段值执行数学函数,常见的计算包括统计提及特定值的文档数量,用于计算分面。其他支持的操作有求和、平均值(均值、众数和中位数)、标准差和方差等。还能使用 C++ 编写用户定义的函数,并在运行时将其插入 MarkLogic Server,以提供自定义的复杂范围数学计算。
范围索引的其他操作还包括计算搜索结果的热图密度,并可将其覆盖在地图上,也能执行共现计算,即查看每个搜索结果中的两个或多个字段的值同时出现的频率,这有助于发现模式,如医疗状况与 Twitter 上提及的产品之间的联系。

1.3 MarkLogic Server 的细粒度结果检索

大多数搜索引擎对整个文档进行搜索查询,而 MarkLogic Server 允许指定文档的子集并进行搜索。这在将搜索限制在特定部分而非整个文档或单个字段时特别有用,例如书籍摘要、文章评论或推文文本(推文实际上有数十个字段,并非只是简短的文本字符串)。

1.4 MarkLogic Server 评估

MarkLogic

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值