ElasticSearch基本概念_分布式实时文件存储,可将每一个字段存入索引,使其可以被检索到。-优快云博客

Elasticsearch 是一个实时的分布式搜索分析引擎，它能让你以一个之前从未有过的速度和规模，去探索你的数据。它被用作全文检索、结构化搜索、分析以
及这三个功能的组合.
ES=elaticsearch简写， Elasticsearch是一个开源的高扩展的分布式全文检索引擎，它可以近乎实时的存储、检索数据；本身扩展性很好，可以扩展到上百台服
务器，处理PB级别的数据。
Elasticsearch也使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能，但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性，从而让
全文搜索变得简单。
1）Lucene只是一个库。想要使用它，你必须使用Java来作为开发语言并将其直接集成到你的应用中，更糟糕的是，Lucene非常复杂，你需要深入了解检索的相关知识来理解它是如何工作的。
2）Elasticsearch也使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能，但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性，从而
让全文搜索变得简单。
ES主要解决问题：
       1）检索相关数据；
       2）返回统计结果；
       3）速度要快
       index（索引）: 相当于mysql中的数据库
       type（类型）: 相当于mysql中的一张表
       document（文档）: 相当于mysql中的一行（一条记录）
       field（域）: 相当于mysql中的一列（一个字段）
       节点: 一个服务器，由一个名字来标识
       集群: 一个或多个节点组织在一起
       分片: 当有大量的文档时，由于内存的限制、磁盘处理能力不足、无法足够快的响应客户端的请求等，一个节点可能不够。这种情况下，数据可
                               以分为较小的分片。每个分片放到不同的服务器上,当你查询的索引分布在多个分片上时，ES会把查询发送给每个相关的分片，并将结果组合在一起，而应用程序并不知道分片的存在。即：这个过程对用户来说是透明的。
       副本: 复制数据，一个节点出问题时，其余节点可以顶上。
和传统数据库MYSQL的比较：
       （1）关系型数据库中的数据库（DataBase），等价于ES中的索引（Index）
       （2）一个数据库下面有N张表（Table），等价于1个索引Index下面有N多类型（Type），
       （3）一个数据库表（Table）下的数据由多行（ROW）多列（column，属性）组成，等价于1个Type由多个文档（Document）和多Field组成。
       （4）在一个关系型数据库里面，schema定义了表、每个表的字段，还有表和字段之间的关系。与之对应的，在ES中：Mapping定义索引下的Type的字段处理规则，即索引如何建立、索引类型、是否保存原始索引JSON文档、是否压缩原始JSON文档、是否需要分词处理、如何进行分词处理等。
       （5）在数据库中的增insert、删delete、改update、查search操作等价于ES中的增PUT/POST、删Delete、改_update、查GET.
ELK：
       ELK=elasticsearch+Logstash+kibana
       elasticsearch：后台分布式存储以及全文检索
       logstash: 日志加工、“搬运工”
       kibana：数据可视化展示。
       ELK架构为数据分布式存储、可视化查询和日志解析创建了一个功能强大的管理链。三者相互配合，取长补短，共同完成分布式大数据处理工作。
   ES特点和优势
       1）分布式实时文件存储，可将每一个字段存入索引，使其可以被检索到。
       2）实时分析的分布式搜索引擎。
       分布式：索引分拆成多个分片，每个分片可有零个或多个副本。集群中的每个数据节点都可承载一个或多个分片，并且协调和处理各种操作；
       负载再平衡和路由在大多数情况下自动完成。
       3）可以扩展到上百台服务器，处理PB级别的结构化或非结构化数据。也可以运行在单台PC上（已测试）
       4）支持插件机制，分词插件、同步插件、Hadoop插件、可视化插件等