大白话ElasticSearch是什么以及应用场景

https://blog.youkuaiyun.com/paicMis/article/details/82535018

                    版权声明:本文为博主原创文章,未经博主允许不得转载。                        <a class="copy-right-url" href=" https://blog.youkuaiyun.com/paicMis/article/details/82535018"> https://blog.youkuaiyun.com/paicMis/article/details/82535018</a>
                </div>
                                                <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-3019150162.css">
                                    <div id="content_views" class="markdown_views prism-atom-one-dark">
                <!-- flowchart 箭头图标 勿删 -->
                <svg xmlns="http://www.w3.org/2000/svg" style="display: none;">
                    <path stroke-linecap="round" d="M5,0 0,2.5 5,5z" id="raphael-marker-block" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);"></path>
                </svg>
                                        <p>ElasticSearch是一个分布式,高性能、高可用、可伸缩的搜索和分析系统 <br>

看了上面这段话,估计很多人都懵了,这个是啥。我们先从搜索说起,先介绍下面几点

1、什么是搜索

百度、Google:我们想寻找一个我们喜欢的电影或者书籍就会去百度或者Google搜索一下。

互联网搜索:电商搜索商品,招聘网站搜索简历或者岗位

IT系统的搜索:员工管理搜索,会议管理搜索

2、如果用数据库做搜索会怎么样

在软件开发里面,数据都是存储在数据库里面的,比如电商网站的商品信息,员工的信息等等,如果从员工角度去做搜索功能,我们会这么设计

这里写图片描述

以上会存在几个问题:
1. 如果表记录上千万上亿了这个性能问题,另外一个如果有一个本文字段要在里面模糊配置,这个就会出现严重的性能问题
2. 还不能将搜索词拆分开来,比如上面这个只能搜索名字是“张三”开头的员工,如果想搜出“张小三”那是搜索不出来的。
总体来说,用数据库来实现搜索,是不太靠谱的,通常性能也会很差
3、什么是全文检索、倒排索引和Lucene
举个简单的例子:比如最近上映的热剧(碟中谍6:全面瓦解),我们想搜索一下全面瓦解这个电视剧,可是在输入的过程,不小心输入了”全瓦解”,我们看看百度这个返回了什么,百度返回的结果确实是我想要找到的内容,现在我们介绍一下全文检索和倒排索引是什么
这里写图片描述

我们看看下面这个图,假如我们有很多数据”全面瓦解电影,全面瓦解海报,全面瓦解评论,全面瓦解文章”等等信息,从数据到构建倒排索引的过程我们图中标记为“1”,通俗一点讲就是,倒排索引就是讲数据中的词拆分构建一个大表,将关键字拆出来,后面带上这个文章的documentid号,例如中间这个就是倒排索引了。

全文检索就比较好理解的,就是当我们输入“全瓦解”,会被拆分成”全”,“瓦解”2个此,用2个词去倒排索引里面去检索数据,检索到的数据返回。整个过程就叫做全文检索
这里写图片描述
如果这个用数据库的思维来做的话,假如一共100W的记录,按照之前的思路就是扫描100W次,而且每次扫描,都需要匹配那个文本所有的字符,确认是否包含搜索的关键词,而且还不能将搜索词拆解来进行检索
如果是利用倒排索引的话,假设还是100W,拆分出来的词语,假设有1000W个词语,那么在倒排索引中,就有1000W行。我们可能不需要检索1000W词,有可能检索1次,就能找到我们需要的数据,也有可能是100W次,也有可能是1000W次

lucene:就是一个jar包,里面包含了封装好的各种建立倒排索引,以及进行搜索的代码,包括各种算法。我们就用java开发的时候

3、ElasticSearch是什么
Lucene是单机的模式,如果你的数据量超过了一台物理机的容量,你需要扩容,将数据拆分成2份放在不同的集群,这个就是典型的分布式计算了。需要拷贝容错,机器宕机,数据一致性等复杂的场景,这个实现就比较复杂了。
ES解决了这些问题
1、自动维护数据的分布到多个节点的索引的建立,还有搜索请求分布到多个节点的执行
2、自动维护数据的冗余副本,保证了一旦机器宕机,不会丢失数据
3、封装了更多高级的功能,例如聚合分析的功能,基于地理位置的搜索
这里写图片描述

ElasticSearch的功能

  1. 分布式的搜索引擎和数据分析引擎
    搜索:网站的站内搜索,IT系统的检索
    数据分析:电商网站,统计销售排名前10的商家
  2. 全文检索,结构化检索,数据分析
    全文检索:我想搜索商品名称包含某个关键字的商品
    结构化检索:我想搜索商品分类为日化用品的商品都有哪些
    数据分析:我们分析每一个商品分类下有多少个商品
  3. 对海量数据进行近实时的处理
    分布式:ES自动可以将海量数据分散到多台服务器上去存储和检索
    海联数据的处理:分布式以后,就可以采用大量的服务器去存储和检索数据,自然而然就可以实现海量数据的处理了
    近实时:检索数据要花费1小时(这就不要近实时,离线批处理,batch-processing);在秒级别对数据进行搜索和分析

ElasticSearch的应用场景

  1. 维基百科
  2. The Guardian(国外新闻网站)
  3. Stack Overflow(国外的程序异常讨论论坛)
  4. GitHub(开源代码管理)
  5. 电商网站
  6. 日志数据分析
  7. 商品价格监控网站
  8. BI系统
  9. 站内搜索

ElasticSearch的特点

  1. 可以作为一个大型分布式集群(数百台服务器)技术,处理PB级数据,服务大公司;也可以运行在单机上,服务小公司
  2. Elasticsearch不是什么新技术,主要是将全文检索、数据分析以及分布式技术,合并在了一起
  3. 对用户而言,是开箱即用的,非常简单,作为中小型的应用,直接3分钟部署一下ES
  4. Elasticsearch作为传统数据库的一个补充,比如全文检索,同义词处理,相关度排名,复杂数据分析,海量数据的近实时处理;
### RestTemplate 的基本概念及作用 `RestTemplate` 是 Spring 提供的一个同步客户端工具类,用于简化 HTTP 请求的发送和接收操作。它可以方便地与 RESTful 服务交互,支持 GET、POST、PUT、DELETE 等常见的 HTTP 方法[^1]。 以下是 `RestTemplate` 的主要功能和特点: #### 功能概述 - **HTTP 请求封装**:`RestTemplate` 封装了底层的 HTTP 客户端实现细节,开发者无需关心具体的网络通信逻辑。 - **多种数据格式支持**:可以轻松处理 JSON、XML 或其他自定义的数据格式,通常配合消息转换器(如 `HttpMessageConverter`)完成序列化和反序列化工作[^2]。 - **灵活的方法调用**:提供了丰富的 API 来执行不同类型的 HTTP 请求,例如 `exchange()` 和 `execute()` 方法允许更复杂的场景定制。 #### 使用示例 下面展示如何利用 `RestTemplate` 发送简单的 GET 和 POST 请求: ```java // 创建 RestTemplate 实例 RestTemplate restTemplate = new RestTemplate(); // 执行 GET 请求并获取响应对象 String url = "https://api.example.com/data"; ResponseEntity<String> response = restTemplate.getForEntity(url, String.class); System.out.println("Status Code: " + response.getStatusCode()); System.out.println("Body: " + response.getBody()); // 执行 POST 请求 Map<String, String> requestBody = Map.of("key", "value"); HttpHeaders headers = new HttpHeaders(); headers.setContentType(MediaType.APPLICATION_JSON); HttpEntity<Map<String, String>> requestEntity = new HttpEntity<>(requestBody, headers); ResponseEntity<Void> postResponse = restTemplate.postForEntity( "https://api.example.com/create", requestEntity, Void.class ); System.out.println("Post Response Status: " + postResponse.getStatusCode()); ``` 上述代码片段展示了如何通过 `getForEntity` 和 `postForEntity` 方法分别发起 GET 和 POST 请求,并打印服务器返回的状态码以及响应体内容[^3]。 #### 应用场景 - 调用第三方 REST 接口:当需要集成外部系统的 RESTful API 时,`RestTemplate` 可以快速构建请求并解析结果。 - 微服务间通信:在一个分布式架构下,各个微服务之间可以通过 `RestTemplate` 进行相互调用,从而实现模块解耦和服务协作[^4]。 尽管如此,在现代应用开发中需要注意的是,官方推荐逐渐迁移到更加高效的异步解决方案,比如 WebClient (来自 Spring 5),因为它更适合处理高并发环境下的非阻塞 I/O 操作[^5]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hello_world!

你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值