在Elasticsearch中,数据流(Data Streams)是一种用于处理时间序列数据的高级功能,它提供了一种高效、可扩展的方式来管理和查询大量的时序数据。以下是结合网页内容对Elasticsearch中“使用数据流”的详细说明:
---
1.什么是数据流?
数据流是一种逻辑结构,用于管理时间序列数据。它由多个后端索引(Backing Indices)组成,这些索引在内部自动管理,用户无需手动操作。数据流的主要特点是:
• 自动滚动(Rollover):当达到预设的条件(如索引大小或文档数量)时,数据流会自动创建一个新的后端索引,以确保性能和可扩展性。
• 追加只读:数据流仅支持添加新文档,不能直接更新或删除文档,这有助于保持数据的一致性和性能。
• 时间序列优化:数据流特别适合处理时间序列数据,例如日志、监控数据等。
---
2.数据流的主要操作
2.1 向数据流添加文档
单个文档
使用`index`API向数据流添加单个文档。支持摄取管道(Ingest Pipelines),可以在索引时对数据进行预处理。
```http
POST /my-data-stream/_doc/
{
"@timestamp": "2099-03-08T11:06:07.000Z",
"user": {
"id": "8a4f500d"
},
"message": "Login successful"
}
```
• 注意:不能使用`PUT /<target>/_doc/<_id>`格式添加文档,而应使用`PUT /<target>/_create/<_id>`。
多个文档
使用`bulk`API批量添加文档,支持`create

最低0.47元/天 解锁文章
926

被折叠的 条评论
为什么被折叠?



