
elasticsearch
文章平均质量分 80
行走江湖
方向:分布式计算、实时流计算、数据挖掘、后台开发、NoSQL、Hadoop/HBase、Unix/Linux、Java、C/C++、Python。
联系方式:http://t.qq.com/X-L2008
QQ:394102339
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ElasticSearch安装ik分词插件
一、IK简介 IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开 始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。转载 2014-07-17 20:16:08 · 890 阅读 · 0 评论 -
ElasticSearch字段排序
需求 如果我们需要根据一个字段进行排序,如何支持呢? 像日期、价格这些数值型的(日期底层其实是转换为数值),排序其实是很自然也是很简单的。但是如果是字符串类型的字段呢?有几个问题需要考虑: 分词对排序的影响大小写、单复数之类区别 字符串类型的字段一般都需要进行搜索的,那么需要对其进行Analyzed。但是Analyzed的结果就是将该字符串解析为分散的token(term)。这样子,E转载 2014-10-16 14:49:11 · 9504 阅读 · 0 评论 -
Elasticsearch 的坑爹事——记录一次mapping field修改过程
团队使用Elasticsearch做日志的分类检索分析服务,使用了类似如下的_mapping { "settings" : { "number_of_shards" : 20 }, "mappings" : { "client" : { "properties" : { "ip" : {转载 2014-11-01 11:58:39 · 2909 阅读 · 0 评论 -
es分布式 索引复制异常:org.elasticsearch.transport.RemoteTransportException: Failed to deserialize exception
[java] view plaincopy org.elasticsearch.transport.RemoteTransportException: Failed to deserialize exception response from stream Caused by: org.elasticsearch.transport.TransportSeria转载 2014-07-30 18:54:10 · 5648 阅读 · 0 评论 -
生产环境使用elasticsearch遇到的一些问题以及解决方法(不断更新)
1.由gc引起节点脱离集群 因为gc时会使jvm停止工作,如果某个节点gc时间过长,master ping3次(zen discovery默认ping失败重试3次)不通后就会把该节点剔除出集群,从而导致索引进行重新分配。 解决方法: (1)优化gc,减少gc时间。(2)调大zen discovery的重试次数(es参数:ping_retries)和超时时间(es参数:p转载 2014-07-31 12:19:36 · 1229 阅读 · 0 评论 -
Lambda架构
Hadoop框架带来了批量数据处理,但是网络规模大数据的实时处理仍然是一个挑战。 有很多技术可以用来建立这样一个完整的数据处理系统 - 但要选择合适的工具并且编排使用它们却是复杂和艰巨的。 Nathan Marz将任何数据系统都可定义为: “query = function(all data)” Lambda系统架构定义了一套明确的架构原则,如果要建立一套强大的和可扩展的数据系统转载 2014-07-13 10:41:49 · 1089 阅读 · 0 评论 -
ElasticSearch的安装和相关插件的安装
本文主要介绍如下内容: 1、ElasticSearch的安装(Windows 和 Linux) 2、ElasticSearch插件安装 3、ElasticSearch源码集成到Eclipse 1、ElasticSearch的安装 1)Windows环境转载 2014-07-01 23:05:33 · 608 阅读 · 0 评论 -
GitHub使用elasticsearch遇到的一些问题及解决方法
GitHub使用elasticsearch遇到的一些问题及解决方法 GitHub此前的搜索使用Solr实现,新上线的搜索基于elasticsearch,运行在多个集群上。由于代码搜索索引很大,GitHub专门为其指定了一个集群。目前该集群包括26个存储节点和8个客户端节点。存储节点负责保存构成搜索索引的数据,而客户端节点负责协调查询活动。每个搜索节点中有2TB的SSD存储。转载 2014-05-29 13:11:46 · 1432 阅读 · 0 评论 -
ElasticSearch: Java API
ElasticSearch provides Java API, thus it executes all operations asynchronously by using client object. Client object can execute the operations in a bulk accumulatively. Java API can be used interna转载 2014-07-01 22:58:10 · 1281 阅读 · 0 评论 -
Kibana和logstash快速搭建实时日志查询、收集与分析系统
Logstash是一个完全开源的工具,他可以对你的日志进行收集、分析,并将其存储供以后使用(如,搜索),您可以使用它。说到搜索,logstash带有一个web界面,搜索和展示所有日志。 kibana 也是一个开源和免费的工具,他可以帮助您汇总、分析和搜索重要数据日志并提供友好的web界面。他可以为 Logstash 和 ElasticSearch 提供的日志分析的 Web 界面 说到这里,我们转载 2014-05-27 17:37:08 · 840 阅读 · 0 评论 -
用 elasticsearch 和 logstash 为数十亿次客户搜索提供服务
今天非常高兴的欢迎我们的第一个外来博主,Rackspace软件开发工程师,目前为Mailgun工作的Ralph Meijer。我们在 Monitorama EU 会面后,Ralph 提出可以给我们写一篇 Mailgun 里如何使用 Elasticsearch 的文章。他本人也早就活跃在 Elasticsearch 社区,经常参加我们在荷兰的聚会了。 Mailgun 收发大量电子邮转载 2014-05-27 17:22:06 · 2128 阅读 · 0 评论 -
ElasticSearch的各种服务的URL(转)
前言 elasticsearch 将各种功能、配置、服务都以API的形式暴露,这也是elasticsearch区别于其他搜索引擎框架的一个特征。这几天在看一个elasticsearch的培训资料,将资料中提到的URL单独罗列了出来。 索引相关 URL 说明 /index/_search 不解释 /_aliases 获取或操作索引的别名转载 2014-05-27 14:46:06 · 884 阅读 · 0 评论 -
ElasticSearch 原理笔记
设计原理看ElasticSearch作者Shay Banon的PPT就可以了 The Road to a Distributed, (Near) Real Time, Search Engine Shay Banon - @kimchy https://speakerdeck.com/kimchy/the-road-to-a-distributed-search-eng转载 2014-05-27 14:41:24 · 1445 阅读 · 0 评论 -
ElasticSearch入门笔记
lasticSearch 是构建在Apache Lucene之上的的搜索引擎服务,开源(Apache2协议),分布式,RESTful。安装方便,使用简单。 官方站点:http://www.elasticsearch.com/ 中文站点:http://es-cn.medcl.net/ 1.安装 必须先安装Java环境,并设置 JAVA_HOME => C:\Program Fil转载 2014-05-27 14:03:38 · 684 阅读 · 0 评论 -
Mapping WordPress Posts to Elasticsearch
I thought I’d share the Elasticsearch type mapping I am using for WordPress posts. We’ve refined it over a number of iterations and it combines dynamic templates and multi_field mappings along with转载 2015-01-21 22:07:50 · 814 阅读 · 0 评论