Elasticsearch之入门知识

最新推荐文章于 2025-09-12 20:46:57 发布

weixin_30565199

最新推荐文章于 2025-09-12 20:46:57 发布

阅读量49

点赞数

CC 4.0 BY-SA版权

文章标签：大数据运维 json

原文链接：http://www.cnblogs.com/chy-op/p/9869922.html

Elasticsearch是一款开源的全文搜索和分析引擎，适用于大规模数据的快速存储、搜索与分析。它可应用于在线商店产品搜索、日志数据分析、价格警报平台及大数据调查分析等场景。通过近实时搜索、集群、节点、索引、类型、文档和分片等核心概念，实现高可用性和高性能。

elasticsearch是一个高度可扩展得开源全文搜索和分析的引擎。可以快速、近实时的存储，搜索和分析大量数据。通常用作底层引擎技术，为具有复杂搜索功能和要求的程序提供支持。

用处：

　　• 运行网上商店，允许客户搜索产品。可以使用elasticsearch存储整个产品目录和库存，并为它们提供搜索和自动填充建议。

　　• 收集日志或交易数据，并且可以分析和挖掘此数据以查找趋势，统计信息，摘要或异常。可以使用logstash将收集到的数据提供给elasticsearch，然后elasticsearch可以运行搜索和聚合来挖掘需要的信息。

　　• 运行价格警报平台，允许精通价格的客户指定的一条规则，例如我想要购买的商品在下个月从任何供应商降价n元，我希望收到通知。这样可以刮取供应商价格，将其推入elasticsearch并使用其反响搜索功能来匹配价格变动与客户查询，并最终在发现匹配后将警报推送给客户。

　　• 快速调查，分析，可视化并询问有关大量数据的特定问题，数百万或数十亿条记录。可以使用elasticsearch存储数据，然后使用kibana构建自定义仪表板。

基本概念：

近实时（NRT）

　　elasticsearch是一个近实时的搜索平台，从索引文档到可搜索文档的时间有一点延迟，大概是一秒。

集群

　　集群是一个或多个节点的集合，它们共同保存整个数据，并提供跨所有节点的联合索引和搜索功能。集群由唯一名称标识，默认情况下为“elasticsearch”。这个名称很重要，因为如果节点设置为按名称加入集群，则该节点只能是集群的一部分。

　　注意不要在不同的环境中重用相同的集群名称，否则最终会导致节点加入到错误的集群里。例如，可以使用logging-dev，logging-test，logging-prod。

　　如果集群里只有一个节点，那么它是完全正常的。拥有多个独立的集群的话，每个集群都有自己唯一的名称。

节点

　　节点是作为集群里的单个服务器，存储数据并参与集群的索引和搜索功能。节点由名称标识，默认情况下，该名称是在启动时分配给节点的随机通用唯一标识符（UUID）。也可以自己定义所需的任何节点名称。此名称对于管理目的非常重要，可以在其中识别网络中哪些服务器与elasticsearch集群中的哪些节点相对应。

　　可以将节点配置为按集群名称加入特定集群。默认情况下，每个节点都设置为加入一个名为cluster的进去elasticsearch，这意味着如果在网络上启动许多节点并且假设它们可以互相发现，它们将自动形成并加入一个名为elasticsearch的集群。在单个集群中，可以拥有任意数量的节点。