Solr 简介

最新推荐文章于 2025-12-30 16:01:01 发布

原创最新推荐文章于 2025-12-30 16:01:01 发布 · 126 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#Solr #lucene #配置管理 #XML #浏览器

全文检索专栏收录该内容

7 篇文章

订阅专栏

Solr是一款企业级搜索服务器，具备先进的全文检索能力、优化的Web流量处理及灵活的配置选项。支持HTTP接口进行数据索引与查询，并提供HTML管理界面。Solr的特点包括：动态字段与唯一键、强大的查询语言扩展、层面浏览与过滤、可配置的文本分析等功能。

英语原文（官方）翻译

Solr 简介

Solr 是一个带有web界面的企业级搜索服务器。它通过http协议将xml格式的文件进行索引，通过http协议进行查询，返回结果为xml格式。

* 先进的全文搜索能力

* 优化的web流量

* 基于开放接口（xml&http）的标准

* 集成的HTML管理界面

* 可扩展性-与其它Solr 服务器的高效结合

* 通过xml配置实现的灵活性和适应性

* 可扩展的插件体系结构

Solr使用Lucene查询库并对其进行了扩展

* 带有动态Field(Dynamic Field)和唯一键（Unique Key）的实数据模式

* 对lucene查询语言的强大扩展

* 支持动态层面浏览和过滤

* 高级可配置的文本分析

* 高度可配置和用户可扩展的缓存（Caching）

* 性能优化

* 通过xml的外部配置

* 管理界面

* 日志功能

* 快速增加的更新和快照功能

细节特征

Schema(模式) ，在Solr里面的一个xml文件

* 定义可用的field类型和document中可以使用的field

* 驱动更加智能处理过程

* Lucene分析器的说明

* 动态Field(Dynamic Fields)使得field的增加更快速

* CopyField 功能对某单个的field进行多种方式的索引或者将多种field结合到某个field（目的是加快搜索的速度）

* 模糊类型（Explicit types）省略了对field类型的猜测

* 基于文件的停用词，同义词，保护词外部配置

查询（Query）

* 带有返回格式可配置（XML/XSLT, JSON, Python, Ruby）的HTTP接口

* 高亮文本片段显示

* 基于field值和明晰查询的层面搜索（Faceted Searching）

* 添加到查询语言中的排序说明

* 函数查询—通过filed的数值和顺序值的函数影响得分

* 性能优化

* 前缀查询，得分范围查询

Core

* 可插入的查询处理器（query handlers）和可扩展的xml数据格式

* 基于单键值field(unique key field)的强制的document唯一性

* 批量更新和删除

* 用户可配置的索引改变触发命令

* 搜索并发控制

* 正确的数值类型处理，以支持排序和范围查询

* 对没有用于排序的 field的document的正确处理

* 查询结果的动态分组

缓存（Caching）

* 可配置的查询结果、过滤器、Document缓存实例

* 可添加的缓存实现

* 后台缓存“预热”

当一个新的查询器打开，可配置的查询就开始运行，以避免首次查询返回结果较慢，“预热”期间，当前查询继续进行

* 后台自动“预热”

当前的搜索器的缓存中包含经常访问的元素，当新的搜索器建立时自动将其加入，以提高缓存的命中率

* 快速/小型过滤器的实现

* 使用自动“预热”的用户级缓存