《读书报告 -- Elasticsearch入门》---- 简单使用（2）

Elasticsearch 分布式存储与搜索基础

最新推荐文章于 2025-12-02 09:42:37 发布

shiter

最新推荐文章于 2025-12-02 09:42:37 发布

阅读量1.7k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：大数据机器学习实践探索文章标签：大数据 ES

原文链接：https://season.blog.youkuaiyun.com/article/details/54236333

大数据机器学习实践探索专栏收录该内容

130 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

文章大纲

《读书报告 -- Elasticsearch入门》
**第四章分布式文件存储**
- 4.1 路由文档到分片
- 4.2 主分片和复制分片的交互
- 4.3 新建、索引和删除文档
- - - `timeout`
- 4.5 局部更新文档
- 4.6 多文档模式
- **第五章搜索——基本的工具**
- 5.1 空搜索
- - - `hits`
  - - `took`
  - - `shards`
  - - `timeout`
- 警告
- 5.2 多索引和多类别
- 5.3 分页
- 5.4 简易搜索
- - `_all`字段
  - 更复杂的语句
- 6.1 映射及分析
- 6.2 确切值 vs 全文文本
- 6.3 倒排索引
- - IMPORTANT
- 6.4 分析和分析器
- - 字符过滤器
  - 分词器
  - 标记过滤
  - 内建的分析器
  - 标准分析器
  - 简单分析器
  - 空格分析器
  - 语言分析器
  - 当分析器被使用
  - 测试分析器
  - 指定分析器
- 6.5 映射
- - 核心简单字段类型
  - 查看映射
  - 小提示
  - 自定义字段映射
  - `index`
  - 分析
  - 更新映射
  - - 重要
  - 测试映射
- 6.6 复合核心字段类型
- - 多值字段
  - 空字段
  - 多层对象
  - 内部对象的映射
  - 内部对象是怎样被索引的
- 对象-数组
- - 内部对象数组
- 第七章请求体查询
- 7.2 结构化查询Query DSL(Query Domain Specific Language)
- - 查询子句
  - 合并多子句
- 7.3 查询与过滤
- - - 性能差异
    - 什么情况下使用
- 7.4 最重要的查询
- `match_all` 查询
- `match` 查询
- `multi_match` 查询
- `range` 过滤
- `term` 过滤
- `terms` 过滤
- `exists` 和 `missing` 过滤
- 7.5 查询与过滤条件的合并
- `bool` 过滤
- `bool` 查询
- 7.6 验证查询
- 理解错误信息
- 7.7 总结
- 第八章相关性排序
- 8.1 排序方式
- 字段值排序

《读书报告 – Elasticsearch入门》

第四章分布式文件存储

这章的主要内容是理解数据如何在分布式系统中存储。

4.1 路由文档到分片

创建一个新文档时，它是如何确定应该存储在分片1还是分片2上的呢？

这个过程不是随机的，因为将来要检索文档。事实上，它根据一个简单的算法决定：

shard = hash(routing) % number_of_primary_shards

routing值是一个任意字符串，它默认是_id但也可以自定义。这个routing字符串通过哈希函数生成一个数字，然后除以主切片的数量得到一个余数(remainder)，余数的范围永远是0到number_of_primary_shards - 1，这个数字就是特定文档所在的分片。

这也解释了为什么主分片的数量只能在创建索引时定义且不能修改：如果主分片的数量在未来改变了，所有先前的路由值就失效了，文档也就永远找不到了。

所有的文档API（get、index

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。