elasticsearch执行增删改document的内部原理

最新推荐文章于 2020-09-04 14:42:58 发布

原创最新推荐文章于 2020-09-04 14:42:58 发布 · 284 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#document内部原理 #document路由

客户端访问es的过程如下：

（1）当用户发送一个请求到任意一个节点，该节点就会成为coordinating node(协调节点)

（2）协调节点，对document进行路由，将请求发送到对应的primary shard 上的node

document路由过程：

①客户端增删改一个document时，会同步带过来一个routing number，默认情况下时document的_id（可手动指定，也可自东生成）

②node会将这个routing，传入到一个hash函数中，产出一个routing的hash值，然后将hash函数产生的值对index对应primary shard的数据取余。计算出最终的primary shard

路由算法：shard = hash(routing) % number_of_primary_shards

③注意：routing的值可以进行指定，比如说put /index/type/id?routing=user_id，即可以将某一类的document路由到一个shard上去，在后续进行应用级别的负载均衡，可以提升批量读取数据的性能。

（3）实际的node将document写完成后，同步数据到对应的replica shard

（4）coordinating node，如果发现primary shard和对应的replica shard 数据执行完成后，就返回相应结果给客户端

注意：任意一个节点都知道任意一个document在哪个node上。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_37910578

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

elasticsearch-全文检索执行流程

gongpulin的博客

11-20

2487

elasticsearch-全文检索执行流程检查字段类型。标题 title 字段是一个 string 类型（ analyzed ）已分析的全文字段，这意味着查询字符串本身也应该被分析。分析查询字符串。将查询的字符串 QUICK! 传入标准分析器中，输出的结果是单个项 quick 。因为只有一个单词项，所以 match 查询执行的是单个底层 term 查询。

ES:document增删改内部原理揭秘

标题

09-26

513

3个primary shard，replica=1，要求至少3个shard是active，3个shard按照之前学习的shard&amp;amp;replica机制，必须在不同的节点上，如果说只有2台机器的话，是不是有可能出现说，3个shard都没法分配齐全，此时就可能会出现写操作无法执行的情况

参与评论您还未登录，请先登录后发表或查看评论

Elasticsearch(033)：es中Document（文档）之删除文档

瘦子没有夏天

09-04

9847

一、概述在上一小节中，我们学习了文档的定义和新增语法。当然，有新增操作，相反的就会有删除操作。es中的文档的删除操作分为两类: 主键删除和查询删除。二、删除文档（主键删除）示例：下面操作的含义删除id为1的文档记录。 DELETE example/docs/1 返回结果 { "_index": "example", "_type": "docs", "_id": "1", "_version": 2, "result": "deleted", "_shards": {

ES增删改查内部原理

Logica的专栏

09-06

1094

一、ES查询内部原理 客户端发起请求到集群协调节点coordinate node 若是根据docId（不是根据docId查询则根据随机轮询算法，分配到所有分片查询）查询则根据路由算法，找到分片根据随机轮询算法，将请求分摊给主备节点，达到负载均衡的目的各个节点将结果返回给协调节点，由协调节点统一返回数据给客户端二、ES增删改内部原理 客户端发起创建的请求到集群协调节点coordi...

Elasticsearch Document Update API详解、原理与示例

中间件兴趣圈

11-10

1万+

本文将详细介绍单文档(Document)的更新API，其更新API如下： public final UpdateResponse update(UpdateRequest updateRequest, RequestOptions options) throws IOException public final void updateAsync(UpdateRequest updateRe...

elasticsearch document 增删改原理

愿风裁尽尘中沙

06-07

572

对于集群而言，任意一个node都知道document在哪个node上的（路由算法），所以，对于client来说，请求任和一个node都是一样的。 client选择任一node，将增（删、改）请求发送到改node 改node接收到request，变为coordinating node（协调节点） coordinating node（协调节点）将请求发送到对应的primary shard，因为是增删...

es增删改查原理

yxm234786的博客

09-02

1122

增删改原理程序先把请求发到任意一个节点上，这节点叫做协调节点，这个协调节点根据路由算法算出文档应该存在那个primary shard，把请求转发到对应的primary shard中存储文档并把数据同步到它的副本上（replica shard）。增删改的原理是一样的。查询的原理程序先给一个节点发送请求，这个节点是协调节点，然后节点用路由算法找出primary shard分片...

大话Elasticsearch常用操作和核心原理

热门推荐

朱培(知浅_ZLH)

11-07

3万+

我们想要寻找某些信息的时候，一般会直接去百度、谷歌、搜歌、360搜索等，搜索分为垂直搜索、互联网搜索、IT系统的搜索。搜索，就是在任何场景下，找寻你想要的信息，这个时候，会输入一段你要搜索的关键字，然后就期望找到这个关键字相关的有些信息...

ES文档的基本操作 - 删除与修改

柏~的博客

04-15

1285

这里写目录标题删除文档修改文档删除文档 DELETE /my_doc/_doc/1 注：文档删除不是立即删除，文档还是保存在磁盘上，索引增长越来越多，才会把那些曾经标识过删除的，进行清理，从磁盘上移出去。修改文档局部：POST /my_doc/_doc/1/_update { "doc": { "name": "慕课" } } 全量替换PUT /my_...

rubygem-mixlib-log-3.0.9-1.el8.tar.gz

08-18

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

C# BMS上位机源码解析：串口通信与数据库存储的关键技术实现

08-18

基于C#语言开发的BMS（电池管理系统）上位机软件的关键技术。文章首先阐述了上位机软件在电池管理系统中的重要性，随后重点讲解了串口通信和数据库存储两个核心技术模块的具体实现方法。对于串口通信部分，文中通过具体的C#代码示例演示了如何利用SerialPort类完成数据的读写操作，并强调了预设串口协议带来的良好扩展性。针对数据库存储方面，则展示了借助ADO.NET或Entity Framework技术实现与SQL Server数据库交互的方式，包括建立连接、执行SQL语句等步骤，从而确保能够高效地保存从串口接收到的数据，以便进一步进行数据分析和处理。适合人群：具有一定编程经验的技术人员，尤其是从事嵌入式系统、物联网设备或电池管理系统开发的相关从业者。使用场景及目标：适用于希望深入了解C#环境下BMS上位机开发流程的学习者；旨在帮助开发者掌握串口通信和数据库存储两大核心技能，提高其解决实际项目中类似问题的能力。其他说明：文中提供的示例代码有助于读者更好地理解和实践文中提到的概念和技术点，在此基础上可根据自身项目的特定需求做适当调整和优化。

08-18

内容概要：本文介绍了两种基于蒙特卡洛方法的风电和光伏功率场景生成方法，分别是普通蒙特卡洛方法和考虑时间相关性的蒙特卡洛方法。普通蒙特卡洛方法通过随机生成风速和光照强度来计算功率，但未考虑时间相关性。而考虑时间相关性的蒙特卡洛方法则利用多元高斯分布构建时间相关性，从而更真实地反映风电和光伏出力的变化情况。文中详细描述了这两种方法的具体步骤，并通过对比分析展示了考虑时间相关性的方法能更好地模拟实际场景。最后，通过后向削减法筛选出典型场景及其概率。适合人群：从事电力系统规划、调度和运营的专业人士，以及对风电和光伏功率预测感兴趣的科研人员和技术开发者。使用场景及目标：适用于需要进行风电和光伏功率预测的项目，旨在提高预测准确性，优化电力系统的运行和管理。其他说明：本文由作者原创编写，提供了详细的理论背景和实施步骤，并附有参考文献供进一步研究。

MATLAB实现数字基带信号编码及功率谱分析：涵盖多种编码方式的技术详解与应用 · 编码方式

08-18

内容概要：本文档详细介绍了使用MATLAB实现常见的数字基带信号编码方法及其功率谱分析。涵盖了单极性和双极性非归零码、归零码、差分码、数字双相码、密勒码、AMI码和HDB3码等多种编码方式。每种编码方式都配有详细的程序注释和技术文档，帮助读者理解其特性和应用场景。文中还提供了具体的MATLAB代码示例，如生成基础波形的函数nrz_generator、计算并绘制功率谱的函数plot_power_spectrum以及各种编码器的具体实现。通过对不同编码方式的频谱分析，展示了它们各自的特点和适用范围。适合人群：对数字通信系统感兴趣的工程技术人员、科研人员及高校相关专业学生。使用场景及目标：适用于希望深入了解数字基带信号编码原理及其功率谱特性的人群。通过实际编程练习，掌握不同类型编码的生成方法和频谱特点，为后续研究和应用打下坚实基础。其他说明：文档不仅提供理论解释，还包括大量实用的MATLAB代码片段，便于读者动手实践。同时，通过对比不同编码方式的功率谱，直观地展示了各自的优缺点，有助于选择最适合特定应用场景的编码方式。

sane-backends-libs-1.0.27-22.el8.tar.gz

08-18

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

大学城水电管理-大学城水电管理系统源码-基于Web的大学城水电管理系统设计与实现-大学城水电管理网站代码

最新发布

08-18

大学城水电管理-大学城水电管理系统-大学城水电管理系统源码-大学城水电管理系统代码-springboot大学城水电管理系统源码-基于springboot的大学城水电管理系统设计与实现-项目代码

bruce-li-anaconda3-2025

08-18

bruce-li-anaconda3-2025

rubygem-psych-3.0.2-107.module_el8.4.0+847+ee687b6c.tar.gz

08-18

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

rubygem-mocha-1.1.0-9.el8.tar.gz

08-18

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

rubygem-puppetserver-ca-doc-1.8.0-1.el8.tar.gz

08-18

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

es全量同步增量同步以及增删改查询

12-28

### Elasticsearch 全量同步与增量同步 #### 一、概念区分全量同步指的是将源数据库中的所有数据一次性迁移到Elasticsearch中。这种方式适用于初次构建索引或当数据量不大时的情况[^3]。增量同步则是指只迁移自上次成功传输之后发生变化的数据条目（即新插入、更新过的记录以及被标记为已删除的项）。这种方法能够显著减少资源消耗并提高效率，尤其是在处理大规模动态变化的数据集上表现优异[^2]。 #### 二、实现方式对比对于**全量同步**而言： - 可以利用Spring Data Elasticsearch框架完成较为复杂的数据映射关系定义，并且整个过程完全由应用程序控制而不依赖额外组件支持[^1]。 ```java // 使用 Spring Data Elasticsearch 进行全量导入的一个简单例子 @Autowired private ElasticsearchOperations operations; public void bulkImport() { List<YourEntity> entities = yourRepository.findAll(); BulkRequestBuilder bulkRequest = new BulkRequest(); for (YourEntity entity : entities) { IndexRequest indexRequest = new IndexRequest("your_index"); indexRequest.source(JSON.toJSONString(entity), XContentType.JSON); bulkRequest.add(indexRequest); } try { BulkResponse responses = bulkRequest.get(); if (!responses.hasFailures()) { System.out.println("Bulk import succeeded."); } else { System.err.println(responses.buildFailureMessage()); } } catch (Exception e) { throw new RuntimeException(e); } } ``` 而针对**增量同步**: - 阿里巴巴开发了一个名为Canal的工具来监听MySQL binlog事件流，从而捕捉到任何DDL/DML语句所引起的变化；随后这些更改会被转发至目标存储系统如Elasticsearch之中。另一种常见的做法是在原生的关系型数据库内部设置触发器机制配合专门的日志表用于追踪变动情况，再借助于后台作业定期读取该日志并将相应改动应用到远端集群内。 ```sql CREATE TRIGGER after_insert_trigger AFTER INSERT ON `source_table` FOR EACH ROW BEGIN INSERT INTO change_log (`operation`, `table_name`, `id`) VALUES ('insert', 'source_table', NEW.id); END; ``` ```sql CREATE TRIGGER after_update_trigger AFTER UPDATE ON `source_table` FOR EACH ROW BEGIN IF NOT ((OLD.col1 <=> NEW.col1 AND OLD.col2 <=> NEW.col2)) THEN INSERT INTO change_log (`operation`, `table_name`, `id`) VALUES ('update', 'source_table', NEW.id); END IF; END; ``` ```sql CREATE TRIGGER after_delete_trigger AFTER DELETE ON `source_table` FOR EACH ROW BEGIN INSERT INTO change_log (`operation`, `table_name`, `id`) VALUES ('delete', 'source_table', OLD.id); END; ``` ```java // Java 定时任务执行变更同步逻辑片段 @Scheduled(cron="*/5 * * * * ?") // 每隔五秒运行一次 public void syncChangesToEs(){ List<Map<String, Object>> changes = getUnprocessedChangeLogs(); // 获取未处理的日志 for(Map<String,Object> logEntry : changes){ String operationType = (String)logEntry.get("operation_type"); switch(operationType.toLowerCase()){ case "insert": performInsertOperation(logEntry); break; case "update": performUpdateOperation(logEntry); break; case "delete": performDeleteOperation(logEntry); break; default: logger.warn("Unknown operation type encountered: "+operationType); } markLogAsProcessed((Integer)logEntry.get("id")); // 将此条日志状态设为已处理 } } private void performInsertOperation(Map<String, Object> entry){ YourEntity entity = convertMapToEntity(entry); IndexRequest request = new IndexRequest("target_index").id(String.valueOf(entry.get("id"))); request.source(convertObjectToJsonBytes(entity), XContentType.JSON); try{ client.index(request, RequestOptions.DEFAULT); }catch(Exception ex){ handleIndexingError(ex.getMessage(),entry); } } private void performUpdateOperation(Map<String, Object> entry){ UpdateRequest updateReq = new UpdateRequest("target_index", String.valueOf(entry.get("id"))) .doc(convertObjectToJsonBytes(entry),XContentType.JSON) .upsert(new BytesArray("{}"),XContentType.JSON); try{ client.update(updateReq,RequestOptions.DEFAULT); }catch(Exception ex){ handleErrorDuringUpdatingRecord(ex.getMessage(),entry); } } private void performDeleteOperation(Map<String, Object> entry){ DeleteRequest deleteReq = new DeleteRequest("target_index", String.valueOf(entry.get("id"))); try{ client.delete(deleteReq,RequestOptions.DEFAULT); }catch(Exception ex){ handleErrorWhileDeletingDocument(ex.getMessage(),entry); } } ``` #### 三、增删改查操作指南无论是采用哪种同步策略，在日常维护过程中都需要掌握基本的操作技能以便及时响应业务需求： - **创建/添加文档** 可以通过发送HTTP POST请求向指定索引下新增加一份JSON格式的内容作为新的文档实例[^4]。 ```bash curl -XPOST 'http://122.51.134.139:9200/myindex/_doc' -d' { "title": "Test Document", "content": "This is a test document." }' ``` - **检索文档** 要查找特定条件下的多份或多类别的资料，则可通过GET方法携带查询字符串参数或者更高级别的DSL语法结构发起搜索命令。 ```bash curl -XGET 'http://122.51.134.139:9200/myindex/_search?q=title:test&size=10' ``` - **修改现有文档** 如果只是部分字段需要调整的话推荐使用PATCH动词加上对应的路径表达式来进行局部刷新；而对于整体替换的情形则更适合PUT动作。 ```bash # 局部更新 curl -XPATCH 'http://122.51.134.139:9200/myindex/_doc/doc_id/_update?pretty=true' -H 'Content-Type: application/json' -d ' {"script":{"inline":"ctx._source.counter += params.count","lang":"painless","params":{"count":1}}}' # 整体覆盖 curl -XPUT 'http://122.51.134.139:9200/myindex/_doc/doc_id?pretty=true' -H 'Content-Type: application/json' -d '{...}' ``` - **移除单个或批量文档** 最后就是关于清理不再需要的信息点了，这同样很简单只需要调用DELETE接口即可达成目的。 ```bash # 删除单一文件 curl -XDELETE 'http://122.51.134.139:9200/myindex/_doc/doc_id' # 批量清除满足一定规则的结果集合 curl -XPOST 'http://122.51.134.139:9200/myindex/_delete_by_query?conflicts=proceed' -H 'Content-Type: application/json' -d ' { "query": { "match_all": {} }}' ```