全文检索框架的介绍与比较

全文检索框架的介绍与对比

主流框架介绍

Lucene:基于Java的开源全文检索引擎工具包,适用于需要自研搜索框架。
ElasticSearch:基于Lucene,开源的高扩展的分布式全文检索引擎。它可以近乎实时(延迟1秒)的存储、检索并处理PB级别的数据。仅支持json(可通过插件支持其他格式),适合实时查询,用于索引更新频繁,需求实时查询的系统。
Solr:基于Lucene,独立的企业级搜索应用服务,支持pdf、word、txt等格式,索引插入时查询效率会降低,不适合近实时查询。
Xapian:基于C++,和Lucene一样,Xapian只是一个搜索引擎工具库,用户可以在其上自己扩展其适合的应用。
Sphinx:基于C++,与MySQL紧密结合,增量索引支持麻烦, sphinx本身不支持中文分词,配置简单,功能单一。

ElasticSearch和Solr对比

对比项目ElasticSearchSolr
支持文档类型仅Json,通过插件(Ingest-Attachment)支持Word等格式Json,Word等
文本操作使用上述插件,对主流格式文件的文本抽取及自动导入通过内置功能导入文档
中文分词支持支持
查询速度实时索引时速度比solr快对已有数据检索较快,实时索引会阻塞导致查询速度变慢
分布式自带分布式管理,扩展性好支持,需要zookeeper管理,扩展性好
流行度高,资料丰富低于ElasticSearch
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值