
elasticsearch
Zach-vip
学无止境!!!
展开
-
Elasticsearch安装IK分词器
安装方式大概分为两种:自行编译;使用elasticsearch-rtf版,利用别人编译好的文件进行安装;环境说明:我下载的es版本是:elasticsearch-1.7.4.tar.gz,这里我是用的ik版本是elasticsearch-rtf-1.0.0.zip解压后得到的elasticsearch-analysis-ik-1.2.6.jar文件。方式一:自行编译转载 2016-09-04 23:02:10 · 7557 阅读 · 0 评论 -
Elasticsearch创建索引
<?phpnamespace CronBundle\Command\Elasticsearch;use Symfony\Component\Console\Command\Command;use Symfony\Component\Console\Input\InputArgument;use Symfony\Component\Console\Input\InputInterface;原创 2016-09-04 23:13:33 · 1258 阅读 · 0 评论 -
通过Function Score Query优化Elasticsearch搜索结果
在使用Elasticsearch进行全文搜索时,搜索结果默认会以文档的相关度进行排序,如果想要改变默认的排序规则,也可以通过sort指定一个或多个排序字段。但是使用sort排序过于绝对,它会直接忽略掉文档本身的相关度(根本不会去计算)。在很多时候这样做的效果并不好,这时候就需要对多个字段进行综合评估,得出一个最终的排序。function_score在Elasticsearc原创 2016-11-16 12:13:14 · 5813 阅读 · 5 评论 -
ElasticSearch – nested mappings and filters
还有一个情况下,我们需要帮助ElasticSearch了解我们的数据结构,以便能够充分进行查询 - 复杂对象数组的时候。按理说的ElasticSearch的最佳功能之一是,它使我们能够索引和搜索之间复杂的JSON对象。我们不局限于领域的平面列表,但可以与对象图工作,就像我们使用面向对象语言编程时。然而,有一种情况,我们需要帮助ElasticSearch了解我们的数据结构,以便能翻译 2016-11-18 16:13:20 · 1241 阅读 · 0 评论 -
Elasticsearch分析聚合
Elasticsearch不仅仅适合做全文检索,分析聚合功能也很好用。下面通过实例来学习。一、准备数据{"index":{ "_index": "books", "_type": "IT", "_id": "1" }}{"id":"1","title":"Java编程思想","language":"java","author":"Bruce Eckel","price":70.20,转载 2016-12-22 14:36:32 · 2359 阅读 · 2 评论 -
使用 ElasticSearch Aggregations 进行统计分析
ElasticSearch 的特点随处可见:基于 Lucene 的分布式搜索引擎,友好的 RESTful API……大部分文章都围绕 ELK Stack 和全文搜索展开,本文试图用一个小案例来展示 ElasticSearch Aggregations 在统计分析的强大之处。表单长这样需求:对回收的问卷进行统计,统计方式可能有:看每周/天/小时回收量(可以做成转载 2016-12-23 12:00:01 · 22621 阅读 · 1 评论 -
[Elasticsearch] 聚合 - 时间数据处理(Looking at Time)
时间数据处理(Looking at Time)如果在ES中,搜索是最常见的行为,那么创建日期柱状图(Date Histogram)肯定是第二常见的。为什么要使用日期柱状图呢?想象在你的数据中有一个时间戳。数据是什么不重要-Apache日志事件,股票交易日期,棒球比赛时间-任何拥有时间戳的数据都能通过日期柱状图受益。当你有时间戳时,你经常会想创建基于时间的指标信息:转载 2016-12-23 17:57:00 · 1383 阅读 · 0 评论 -
ElasticSearch聚合分析API
前言说完了ES的索引与检索,接着再介绍一个ES高级功能API – 聚合(Aggregations),聚合功能为ES注入了统计分析的血统,使用户在面对大数据提取统计指标时变得游刃有余。同样的工作,你在hadoop中可能需要写mapreduce或hive,在mongo中你必须得用大段的mapreduce脚本,而在ES中仅仅调用一个API就能实现了。开始之前,提醒老司机们注意,ES原有的转载 2016-12-19 15:54:39 · 12380 阅读 · 2 评论 -
从零开始搭建一个ELKB日志收集系统
当今的软件开发多核以及分布已经成为了常态,基本上稍大型的应用都是多台机器分布式部署。分布式在提高性能的同时也带来了很多问题,今天我们只讨论一点,那就是如何处理多台机器线上系统的日志。以我司的某个应用T为例,部署在了百度云5台机子上,其中一台拥有公网IP,使用了百度云提供的负载均衡服务。每次想要在日志中检索某个关键字时,基本步骤如下:打开五个shell,登陆拥有公网IP的那台机器在另外四个shell...转载 2018-04-28 11:29:29 · 944 阅读 · 0 评论