ES搜索引擎(ElasticSearch)
简介
ES是一个开源的高扩展的分布式全文搜索引擎。他可以提供实施存储,检索数据。可以配置到多台服务器上,最大可处理PB级别的数据。ES也是用Java开发,以Lucene作为核心来实现索引和搜索功能。目前,很多知名的互联网厂商如阿里、新浪、百度等,都在使用ES搜索引擎
ElasticSearch与Solr
ElasticSearch自身内带了分布式管理功能
Solr使用Zookpeeper进行分布式管理
ElasticSearch仅支持JSON格式
Solr可以支持多种数据结构
ElasticSearch主要提供了核心功能,其他功能靠组件完善
Solr提供的功能更加全面
ElasticSearch在实时搜索应用时效率非常高
Solr在传统的搜索应用中表现较好
下载和安装
注意安装时需要确认Java的JDK必须是1.8版本及以上才能运行!
- 访问ElasticSearch官方下载地址,下载对应版本的ElasticSearch压缩包。
- 找到压缩包,解压文件
- 找到安装目录下的bin文件下的elasticsearch文件运行启动
- 当看到9300TCP端口启动和9200Http的Restful端口启动,说明ElasticSearch启动成功

- 访问指定IP:端口号,提示以下信息,说明ElasticSearch服务已经正常启动

安装ElasticSearch的图形管理化界面工具(Head)
- 安装运行环境node.js

- 下载解压head
- 安装grunt

- 执行npm install命令
- 以管理员身份启动cmd,运行grunt server

- 访问指定端口,查看界面

- 配置解决跨域问题
http.cors.enabled: true
http.cors.allow-origin: “*”

- 重启ES服务,ES图形管理界面配置完成

ElasticSearch概念
概述
ElasticSearch是面向文档的,他可以存储整个对象或者文档。然而他不仅可以存储,也可以建立索引,使每个文档中的内容中的内容都可以被检索。ElasticSearch提供了对文档进行索引、搜索、排序、过滤操作。
ElasticSearch与DB之间结构的对比:
DB: Databases(数据库) -> Table(表) -> Rows(一行记录) -> Columns(字段)
ES: Indices(索引库) -> Types(类型) -> Documents(文档) -> Fields(字段)
术语解释
索引(Index): 索引就是相似数据的集合,由一个索引名来标识某个索引,索引名必须全部是小写字母 。在一个集群中可以定义任意多个索引。
类型(Type): 在一个索引中,可以定义一种或多种类型。一个类型相当于对索引的分类分区。通常具有一段共同字段的文档将被定义为一个类型。
文档(Document): 是一个可以被索引的信息单元。在一个索引或类型中可以有任意多个文档。文档以JSON格式来存储,注意文档必须要被索引或赋予一个索引的type
字段(Field): 相当于数据库表的字段,对文档数据根据不同属性进行分类标识。一个文档中有多个字段。
映射(Mapping): Mapping是处理数据的方式和规则方面所做的限制。如名字短的属性、字段的默认值、字段的索引等都可以在mapping中进行设置。相当于数据库中的表结构。
本文介绍了ElasticSearch,一个开源的全文搜索引擎,它具有高扩展性和分布式特性,适用于大规模数据处理。对比了ElasticSearch与Solr的区别,并详细讲述了ElasticSearch的下载安装、图形化界面工具Head的配置以及核心概念,包括索引、类型、文档和字段的定义。
1239

被折叠的 条评论
为什么被折叠?



