
搜索
文章平均质量分 83
「已注销」
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Elasticsearch集群搭建及Python交互
本文记录Elasticsearch物理集群的安装步骤,在3台机器上部署一个集群。行文顺序为整个安装过程从头到尾,期间发现不少问题。因此,本文不适合一步步跟着做,建议您看完整篇文章,然后再开始搭建集群。1 . 环境机器: 3台物理机器,分别为130,132,134操作系统:CentOS 6.6Elasticsearch: 2.3.3 版本确保安装相应版本JDK,使用java -v原创 2016-07-12 17:50:10 · 6703 阅读 · 1 评论 -
ElasticSearch位置搜索
在ElasticSearch中,地理位置通过geo_point这个数据类型来支持。地理位置的数据需要提供经纬度信息,当经纬度不合法时,ES会拒绝新增文档。这种类型的数据支持距离计算,范围查询等。在底层,索引使用Geohash实现。1、创建索引PUT创建一个索引cn_large_cities,mapping为city:{ "mappings": { "city": {原创 2016-08-19 19:02:01 · 7925 阅读 · 0 评论 -
Solr基本概念
搜索基本构成搜索的基本定义,可以表述为以下4个步骤:1) 构建索引: Indexing,对文件、网站、数据库的记录进行处理以便可以进行搜索,被索引的文件称为文档。 构建索引之前,需要对文档的内容、结构、类型深入了解,这对于构建索引很有必要,对内容不理解,很难构建出优秀的搜索引擎。索引是使得文档可搜索的过程,一般是将文档各部分内容切分成词条(token),词条经过词干还原、不区分大小写等方式进行原创 2016-08-11 23:33:50 · 2013 阅读 · 0 评论 -
模糊匹配及Solr关键词自动提示应用
1. 字符串相似度字符串相似度用于衡量2个字符串之间的相似度,这里的相似度一般指形式上的相似,而非语义上的相似。字符串相似度算法是模糊字符串匹配(搜索)的核心内容之一,在搜索引擎中的拼写检查、关键词智能补全中也发挥重要重要。在更高层次的实体链接(识别)或实体消歧应用中,也是重要的研究内容。 字符串的模糊匹配也叫模糊匹配,有点类似于正则表达式匹配,但是存在一些不同。字符串匹配(正则表达式)通常关注精原创 2016-08-13 10:32:41 · 6052 阅读 · 1 评论 -
Solr分面搜索(Faceting)
分面搜索(Faceting)基于索引词项对搜索结果进行分类,同时返回每个分类对应的文档数。用户可以可以分类缩小结果范围。下图是一个结果汇总的例子:Amazon的搜索也提供了非常优秀的分面及相应的过滤:环境Solr的发行版自带了一些很好的例子,使用这些例子研究Solr的各种特性非常合适。我们这里使用Solr自带的techproducts索引作为例子。启动solr:solr -e techproduct原创 2016-08-13 14:54:13 · 1984 阅读 · 0 评论 -
MySQL和Lucene索引对比分析
MySQL和Lucene都可以对数据构建索引并通过索引查询数据,一个是关系型数据库,一个是构建搜索引擎(Solr、ElasticSearch)的核心类库。两者的索引(index)有什么区别呢?以前写过一篇《Solr与MySQL查询性能对比》,只是简单的对比了下查询性能,对于内部原理却没有解释,本文简单分析下两者的索引区别。1. MySQL索引实现在MySQL中,索引属于存储引擎级别的概念,不同存储引转载 2016-08-13 23:32:31 · 2348 阅读 · 0 评论