自然语言处理系列六十九》搜索引擎项目实战》搜索框架技术选型

注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】

自然语言处理系列六十九

搜索引擎项目实战》搜索框架技术选型

搜索引擎框架前面讲到过Lucene、Solr Cloud和Elasticsearch,这几个框架做垂直搜索引擎就是非常不错的选择。但选择哪个更好一些呢?做这个选择需要综合考虑到几点因素,第一要看的技术框架本身哪个更合适,其次考虑自己团队的开发人员对哪个框架更熟悉、研发成本更低,在技术框架相对差不多的情况下,应该选择开发人员都熟悉的一个框架。那么还有一个考虑的因素就是开发的工作量,就是用哪个框架开发的更快选择哪个。这几个因素是需要综合衡量,权衡利弊的,相同的项目也要根据每个公司不同的情况分别对待。下面根据纯技术角度来评估哪个搜索框架更合理。
Lucene是单机版的,适合数据量比较小的情况。但在公司实际业务中,需要考虑到公司的发展因素,未来几个月、半年、一年业务会发展到什么程度,如果能预见到数据量会快速增长,那么就需要考虑的长远一些。Lucene是单机版并不能满足数据日益增长的需求,后面再切换到分布式搜索Solr Cloud或Elasticsearch,开发成本就会成倍增加,代码需要再修改一遍。所以把公司业务发展因素考虑进去,一般不建议使用Lucene,可以直接使用Solr Cloud或Elasticsearch。分布式搜索支持多个节点的分布式,当然也支持单个节点。所以数据量小的时候部署单个节点或者比较少的节点,当数据量增大在根据情况增加节点扩展即可。那么下面就从以下几个方面来对比Solr Cloud和Elasticsearch即可。
1. 历史比较
Apache Solr是一个成熟的项目,拥有庞大而活跃的开发和用户社区,以及Apache品牌。Solr于2006年首次发布到开源,长期以来一直占据着搜索引擎领域,并且是任何需要搜索功能的人的首选引擎。它的成熟转化为丰富的功能,而不仅仅是简单的文本索引和搜索; 如分面,分组,强大的过滤,可插入的文档处理,可插入的搜索链组件,语言检测等。Solr 在搜索领域占据了多年的主导地位。然后,在2010年左右,Elasticsearch成为市场上的另一种选择。那时候,它远没有Solr那么稳定,没有Solr的功能深度,没有思想分享,品牌等等。Elasticsearch虽然很年轻,但它也自己的一些优势,Elasticsearch 建立在更现代的原则上,针对更现代的用例,并且是为了更容易处理大型索引和高查询率而构建的。此外,由于它太年轻,没有社区可以合作,它可以自由地向前推进,而不需要与其他人(用户或开发人员&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

陈敬雷-充电了么-CEO兼CTO

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值