Elasticsearch 数据索引与管理全解析
1. Doc Values 格式
Elasticsearch 中 doc_values_format 属性有三种可用值:
- default :在未指定格式时使用,性能良好且内存使用低。
- disk :将数据存储在磁盘上,几乎不占用内存,但在进行分面和排序操作时性能会略有下降。适用于在分面或排序操作中遇到内存问题的情况。
- memory :将数据存储在内存中,排序和分面功能的性能与标准倒排索引字段相当。索引刷新操作更快,有助于快速变化的索引和较短的索引刷新值。
2. 批量索引以加速索引过程
2.1 批量索引数据准备
Elasticsearch 允许将多个请求合并为一个数据包,并作为单个请求发送。可以混合以下操作:
- 添加或替换索引中的现有文档(index)
- 从索引中删除文档(delete)
- 当索引中没有其他文档定义时,向索引中添加新文档(create)
请求格式要求每行包含一个描述操作的 JSON 对象,后面跟着第二行的 JSON 对象本身。第一行可视为信息行,第二行视为数据行。删除操作例外,只包含信息行。例如:
{ "index": { "_index": "addr", "_type": "contact", "_id": 1 }}
{ "name": "Fyodor Dostoevsky
超级会员免费看
订阅专栏 解锁全文
7670

被折叠的 条评论
为什么被折叠?



