Elasticsearch简介-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_43298211/article/details/142789045

Elasticsearch与传统数据库的区别

安装与配置Elasticsearch

第一章 Elasticsearch简介

搜索引擎的基本概念

搜索引擎是一种软件系统，它能够搜索网络上的信息，并根据一定的算法将搜索结果按照相关性进行排序。用户可以通过输入关键词来查询相关的网页、图片、视频等资源。搜索引擎的工作流程大致可以分为爬取、索引和检索三个阶段：

爬取：通过网络爬虫程序自动抓取互联网上的数据。
索引：对抓取到的数据进行处理并创建索引，以便快速定位信息。
检索：当用户发起查询时，搜索引擎会使用建立好的索引来找到与查询词最匹配的结果。

Elasticsearch是什么

Elasticsearch是一个基于Lucene库的分布式搜索和分析引擎，专为实时应用设计，能够提供全文搜索、结构化搜索以及数据分析等功能。Elasticsearch不仅支持文本搜索，还可以用来存储和管理复杂的数据集，并对其进行高效地搜索、过滤及聚合操作。由于其出色的性能表现以及易于扩展的特点，Elasticsearch被广泛应用于日志分析、监控系统、网站搜索等多个领域。

Elasticsearch的核心特点

分布式架构：天然支持集群部署，可以很容易地横向扩展以应对大量数据或高并发请求。
近实时搜索：文档从被索引到变得可搜索之间的时间非常短，几乎达到即时效果。
RESTful API：采用JSON格式交换数据，提供了简单易用的HTTP接口供开发者调用。
灵活的文档模型：允许动态添加字段而无需预先定义schema。
强大的聚合能力：内置丰富的统计功能，如分组统计、范围统计等。
多种语言支持：官方提供了多种编程语言的客户端库，方便不同技术背景的开发者接入使用。

Elasticsearch与传统数据库的区别

数据存储方式：关系型数据库通常遵循固定的表结构存储数据；而Elasticsearch则更加灵活，允许每个文档拥有不同的字段集合。
查询效率：对于复杂的全文检索场景，Elasticsearch往往比SQL数据库更加快速有效。
事务处理：大多数关系型数据库支持ACID特性（原子性、一致性、隔离性、持久性），适合处理金融交易等需要严格一致性的场合；相比之下，Elasticsearch侧重于快速读写和大规模数据分析，在某些情况下可能牺牲了一定程度的一致性保证。
应用场景：虽然两者都能用于存储和查询数据，但它们各自擅长的应用领域有所不同。例如，在需要执行联接操作或者保持严格事务完整性的场景下，RDBMS可能是更好的选择；而在实现高性能搜索、日志分析等方面，Elasticsearch表现更为出色。

安装与配置Elasticsearch

要开始使用Elasticsearch，首先需要在你的机器上安装Java环境，因为Elasticsearch是基于Java开发的。接着可以从官方网站下载最新版本的Elasticsearch包，解压后即可启动服务。这里以Linux环境下为例说明具体步骤：

下载Elasticsearch：

wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-8.x.x-linux-x86_64.tar.gz

解压缩文件：

tar -xzf elasticsearch-8.x.x-linux-x86_64.tar.gz
cd elasticsearch-8.x.x/

启动Elasticsearch服务：
- 对于生产环境，推荐通过systemd或其他初始化脚本来管理服务。
- 开发测试时可以直接运行命令：
```
./bin/elasticsearch
```
默认情况下，Elasticsearch将在9200端口监听HTTP请求，在9300端口监听集群间通信。
配置调整：根据实际需求修改位于config/目录下的配置文件，比如elasticsearch.yml，设置集群名称、节点名、路径等参数。此外还可以调整JVM堆大小等高级选项来优化性能。