
Elasticsearch
tinyid
Java/Python
Hadoop/Spark/Presto/Kafka/Druid
numpy/matplotlib/pandas/scipy
展开
-
使用Logstash + Elasticsearch作为大数据索引、分析工具
logstash是一个不错的日志监控与分析工具,通过原创 2014-05-08 16:17:13 · 36810 阅读 · 19 评论 -
Elasticsearch基础教程
基础概念 Elasticsearch有几个核心概念。从一开始理解这些概念会对整个学习过程有莫大的帮助。 接近实时(NRT) Elasticsearch是一个接近实时的搜索平台。这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒)。 集群(cluster) 一个集群就是由一个翻译 2014-06-23 15:38:36 · 303031 阅读 · 74 评论 -
一种Elasticsearch数据类型冗余方案
在互联网环境中,我们从不指望用户都是规矩的玩家。原创 2014-08-06 11:31:48 · 8754 阅读 · 4 评论 -
Elasticsearch & Logstash -- 一些经验总结
本文作为一些实践经验的总结,并不保证是最佳实践,原创 2014-08-01 11:27:14 · 25794 阅读 · 6 评论 -
Elasticsearch集群的脑裂问题
所谓脑裂问题(类似于精神分裂),就是同一个集群中的不同节点,对于集群的状态有了bu原创 2014-09-05 18:42:44 · 42211 阅读 · 3 评论 -
Elasticsearch的路由(Routing)特性
Elasticsearch的路由机制与其分片机制有着直接的关系。Elasticsearch的路由机制即是通过哈希算法,将具有相同哈希值的文档原创 2014-10-14 16:54:50 · 33821 阅读 · 4 评论 -
Elasticsearch索引别名的介绍和操作
ES版本 :1.4.1 elasticsearch中的API可以接受一个对应于某个索引的索引名,也可以接受多个索引。索引别名API允许使用一个名字来作为一个索引的别名,所有的API会将别名转化成最终的索引名。一个也可以被映射到多于一个的索引上,当指定这个别名的时候,别名将会自动地扩展到别名的所有的索引上。一个别名也可以与一个过滤器建立关联,这个过滤器在搜索和路由值的时候自动被应用。翻译 2014-12-16 14:34:19 · 40227 阅读 · 0 评论 -
使用朴素贝叶斯算法,通过用户安装的APP列表来推测用户的性别
从本质上来说,这是一个分类问题,类似于通过邮件内容来推测垃圾邮件,通过用户的相关信息来推测用户是否会拖欠贷款,而通过用户的APP安装列表来推测用户的性别也是一个类似的问题。对于贝叶斯算法来首,我们首先需要一个训练集数据,这个训练集是一个已经打好标签的数据。而要对一堆的数据打标签,人工来做是不太合适的,在这里需要结合人类与计算机各自的优势,来半自动化的识别出比较明显的有性别倾向的APP的原创 2015-07-31 14:54:46 · 11618 阅读 · 5 评论 -
映射类型(mapping type)从Elasticsearch中移除
原文:https://www.elastic.co/guide/en/elasticsearch/reference/current/removal-of-types.html注意:在Elasticsearch6.0.0或者或者更新版本中创建的索引只会包含一个映射类型(mappingtype)。在5.x中创建的具有多个映射类型的索引在Elasticsearch6.x中依然会正常工作。在翻译 2018-02-01 00:38:02 · 14711 阅读 · 2 评论