ElasticSearsh–分布式搜索和分析引擎(一)之安装与介绍
1 安装
进入官网下载相应版本的软件
https://www.elastic.co/cn/elasticsearch/
1.1 下载安装包并解压,打开并配置elasticsearch.yml文件

注:
如果要配置集群需要两个节点上的elasticsearch配置的cluster.name相同,都启动可以自动组成集群,这里如果不改cluster.name则默认是cluster.name=my-application。
nodename随意取但是集群内的各节点不能相同
修改后的每行前面不能有空格,修改后的“:”后面必须有一个空格

1.2 可能需要的配置
elasticsearsh对内存数和句柄使用数有限制要求,为了避免报错,进行如下的修改
在文件vi /etc/security/limits.conf
添加如下内容:
* soft nofile 65536
* hard nofile 131072
* soft nproc 2048
* hard nproc 4096
vi /etc/security/limits.d/90-nproc.conf
修改如下内容:
- soft nproc 1024
#修改为 - soft nproc 2048
vi /etc/sysctl.conf
添加下面配置:
vm.max_map_count=655360
并执行命令:sysctl -p
1.4 启动集群
./bin/elasticsearsh
报错如下:

报错原因:不能使用root用户启动,新建chen-es用户再尝试
useradd chen-es
passwd chen-es 密码为:chen
赋予chen-es相应的执行权限
chown -R es:es /root
切换到chen-es,启动es,看到这个页面则表示启动成功


单机模式es安装完成,现在开始部署集群的es
用户chen-es将es的安装包拷贝到其他节点安装目录下

在其他机器上新建chen-es用户,并赋予权限。再将安装好的es拷贝过去,修改配置文件。
需要修改的包括:node名,hostip

其他节点对应修改,即可。
配置完成后,在所有节点上启动es,可以使用-d参数,表示在后台运行。注意一定不要用root用户启动,使用chen-es启动。
访问9200端口,发现除100节点外其他节点无法访问,但jps又正常启动,应该是防火墙未关闭

systemctl status firewalld 查看防火墙状态

发现防火墙为关闭,执行如下命令关闭防火墙
永久关闭防火墙,需切换到root用户执行
关闭防火墙命令:systemctl stop firewalld.service
关闭开机自启动:systemctl disable firewalld.service

关闭成功后,打开网页9200端口,可以正常访问了。

其他节点重复以上步骤,关闭防火墙,并设置开机不自启动。使用如下命令,可查看集群状态
curl -XGET 'http://192.168.218.100:9200/_cluster/health?pretty'

2 倒排索引机制

1)可以作为一个大型分布式集群(数百台服务器)技术,处理PB级数据,服务大公司;也可以运行在单机上,服务小公司
2)Elasticsearch不是什么新技术,主要是将全文检索、数据分析以及分布式技术,合并在了一起,才形成了独一无二的ES;lucene(全文检索),商用的数据分析软件(也是有的),分布式数据库(mycat)
3)对用户而言,是开箱即用的,非常简单,作为中小型的应用,直接3分钟部署一下ES,就可以作为生产环境的系统来使用了,数据量不大,操作不是太复杂
4)数据库的功能面对很多领域是不够用的(事务,还有各种联机事务型的操作);特殊的功能,比如全文检索,同义词处理,相关度排名,复杂数据分析,海量数据的近实时处理;Elasticsearch作为传统数据库的一个补充,提供了数据库所不能提供的很多功能。
2.1 elasticsearch与数据库的类比
| 关系型数据库(比如Mysql) | 非关系型数据库(Elasticsearch) |
|---|---|
| 数据库Database | 索引Index |
| 表Table | 类型Type |
| 数据行Row | 文档Document |
| 数据列Column | 字段Field |
| 约束 Schema | 映射Mapping |

1)索引对象(blog):存储数据的表结构 ,任何搜索数据,存放在索引对象上 。
2)映射(mapping):数据如何存放到索引对象上,需要有一个映射配置, 包括:数据类型、是否存储、是否分词等。
3)文档(document):一条数据记录,存在索引对象上
4)文档类型(type):一个索引对象,存放多种类型数据,数据用文档类型进行标识

本文详细介绍了Elasticsearch的安装过程,包括配置修改、内存限制调整、防火墙设置及集群部署步骤。同时,对比了Elasticsearch与传统数据库的区别,阐述其在全文检索、数据分析和分布式技术方面的独特优势。

被折叠的 条评论
为什么被折叠?



