【Elasticsearch】使用Data Streams

最新推荐文章于 2025-05-30 09:04:07 发布

原创

最新推荐文章于 2025-05-30 09:04:07 发布 · 777 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#elasticsearch

在Elasticsearch中，数据流（Data Streams）是一种用于处理时间序列数据的高级功能，它提供了一种高效、可扩展的方式来管理和查询大量的时序数据。以下是结合网页内容对Elasticsearch中“使用数据流”的详细说明：

---

1.什么是数据流？

数据流是一种逻辑结构，用于管理时间序列数据。它由多个后端索引（Backing Indices）组成，这些索引在内部自动管理，用户无需手动操作。数据流的主要特点是：

• 自动滚动（Rollover）：当达到预设的条件（如索引大小或文档数量）时，数据流会自动创建一个新的后端索引，以确保性能和可扩展性。

• 追加只读：数据流仅支持添加新文档，不能直接更新或删除文档，这有助于保持数据的一致性和性能。

• 时间序列优化：数据流特别适合处理时间序列数据，例如日志、监控数据等。

---

2.数据流的主要操作

2.1 向数据流添加文档

单个文档

使用`index`API向数据流添加单个文档。支持摄取管道（Ingest Pipelines），可以在索引时对数据进行预处理。

```http

POST /my-data-stream/_doc/

{

"@timestamp": "2099-03-08T11:06:07.000Z",

"user": {

"id": "8a4f500d"

"message": "Login successful"

}

```

• 注意：不能使用`PUT /<target>/_doc/<_id>`格式添加文档，而应使用`PUT /<target>/_create/<_id>`。

多个文档

使用`bulk`API批量添加文档，支持`create

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

risc123456

关注关注

11
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

elasticsearch-datastream总结

epitomizelu的专栏

05-12

926

一，什么是datastream datastream是为了更方便的管理时序数据的生命周期而基于ilm扩展的特殊功能。二，datastream的特点 1，文档必须有@timestamp字段 2，定义ilm时无需定义iml别名 3，可以对datastream进行插入和查询文档，但不能删除和更新文档 4，datastream像别名一样管理多个真实索引，索引的名称规则： .ds-datastream名称-yyyy.MM.dd-六位序列号如下（假设datastream名称是test-data-stream）

【Elasticsearch】修改数据流（Data Stream）

risc123456的博客

03-03

751

要更改静态设置，需要更新索引模板，然后通过滚动操作（Rollover）或重新索引（Reindex）将其应用于现有数据流。修改映射时，需要更新数据流所使用的索引模板（Index Template），因为新映射会应用于未来的后端索引（Backing Indices）。• 重新索引是更改现有字段数据类型或更新静态设置的有效方法，但需要创建新的数据流并重新索引数据。2. 更新现有数据流的设置：使用更新索引设置API将更改应用于现有数据流。• 修改数据流的映射和设置需要更新索引模板，并将更改应用于现有数据流。

参与评论您还未登录，请先登录后发表或查看评论

Elasticsearch 7.X data stream 深入详解

铭毅天下Elasticsearch

07-25

8742

直接从一个新概念的认知过程说下 elasticsearch data stream。记得第一次听到 data stream 的时候，还是去年下半年在公交大巴车上早 8 点听魏彬老师的直播，...

Elasticsearch：Data streams（一）

Elastic 中国社区官方博客

11-17

2529

数据流让你可以跨多个索引存储仅追加（append-only）的时间序列数据，同时为你提供一个用于请求的命名资源。数据流非常适合日志、事件、指标和其他持续生成的数据。你可以将索引和搜索请求直接提交到数据流。流自动将请求路由到存储流数据的后备（backing indices）索引。你可以使用索引生命周期管理 (ILM) 来自动管理这些后备索引。例如，你可以使用 ILM 自动将较旧的支持索引移动到更便宜的硬件并删除不需要的索引。随着数据的增长，ILM 可以帮助您降低成本和开销。

聊聊elasticsearch的data-streams

go4it

08-06

948

本文主要研究一下elasticsearch的data-streams。

Elasticsearch：Data streams（二）

Elastic 中国社区官方博客

11-18

1088

datastreams:高效，简洁的流数据处理

05-20

>> > from datastreams import DataStream >> > DataStream ( "Hello, gorgeous." )\ ... . filter ( str . isalpha )\ ... . map_method ( 'lower' )\ ... . count_frequency (). to_list () [( 'e' , 2 ), ( 'g' ...

35. Amazon Kinesis Data Streams

JessicaWin

11-16

273

Amazon Kinesis Data Streams is a service to collect and process largestreamsof data records in real time.

Elasticsearch 7.10 之 Search your data

王大呀呀的博客

01-29

612

搜索查询是对 Elasticsearch 数据流或索引中的数据信息的请求。您可以将查询视为一个问题，以 Elasticsearch 理解的方式编写。根据您的数据，您可以使用查询来获取问题的答案，例如：服务器上的哪些进程需要超过 500 毫秒的响应时间？过去一周内，我网络上的哪些用户运行了 regsvr32.exe ？我网站上的哪些页面包含特定的单词或短语？搜索包含一个或多个查询，这些查询被组合并发送到 Elasticsearch 。与搜索查询匹配的文档会在响应的匹配数或搜索结果中返回。搜索还

ES中数据流Data streams详解

弹指天下

10-08

7113

数据流是可以跨多个索引存储仅限于追加存储的时间序列数据，同时为请求提供单个命名资源。从定义中我们可以看出，数据流的一些特点： 1、可以跨多个索引存储 2、仅限追加存储，不支持删除、修改操作 3、时间序列数据 4、为请求提供单个命名资源，可以理解成天然具有公共的别名

Elasticsearch 7.10 之 Search multiple data streams and indices

王大呀呀的博客

02-01

351

要搜索多个数据流和索引，请将其作为逗号分隔的值添加到搜索 API 的请求路径中。以下请求搜索 my-index-000001 和 my-index-000002 索引。 GET /my-index-000001,my-index-000002/_search { "query": { "match": { "user.id": "kimchy" } } } 您还可以使用索引模式搜索多个数据流和索引。以下请求针对 my-index-* 索引模式。该请求将搜索群集中以

elasticsearch

Stream_who的博客

08-08

388

一、基本概念 1. Node 与 Cluster 1）Elastic 本质上是一个分布式数据库，允许多台服务器协同工作，每台服务器可以运行多个 Elastic 实例 2）单个 Elastic 实例称为一个节点（node）。一组节点构成一个集群（cluster） 2. Index 1）Elastic 会索引所有字段，经过处理后写入一个反向索引（Inverted In...

Elastic：Data stream 在索引生命周期管理中的应用

Elastic 中国社区官方博客

12-03

7999

在我之前的文章中，我已经介绍了 Elasticsearch 的索引生命周期管理： Elasticsearch：Index 生命周期管理入门 Elastic: 使用索引生命周期管理实现热温冷架构索引生命周期管理对于 Time Series Data (TSD) 非常有用。那么到底什么是 Time Series Data 呢？什么是 Time Series Data? TSD 始终与时间戳关联，该时间戳标识创建事件时该数据的时间点事件。例如，它可以是传感器数据（温度测量）或安全设备

独家特性 | 腾讯云大数据ES：一站式索引全托管，自治索引大揭秘！

cloudbigdata的博客

11-15

1842

本篇文章将从PB级日志数据管理的挑战出发，为大家介绍自治索引的基本概念以及优势特性。

Elasticsearch Data Stream 数据流使用

醉鱼的博客

12-06

1401

本文是《Elasticsearch索引生命周期管理ILM》中数据流索引补充篇，文章地址如下： https://mp.weixin.qq.com/s/ajhFp-xBU1dJm8a1dDdRQQ 并且在另一片Elasticsearch的进阶使用-动态模版中也提到了相关数据流索引的内容，有兴趣的可以回过头看一下，地址我也放下面 https://mp.weixin.qq.com/s/C22Zm514qq0gN7BNcnbzCQ 所以本文着重介绍下数据流索引的使用数据流数据流可以跨多个索引存储时间序列数

【Elasticsearch】Set up a data stream 创建data stream

risc123456的博客

03-03

1248

在 Elasticsearch 中，数据流（Data Stream）是一种用于管理时间序列数据的高级功能，它通过自动管理索引的生命周期和版本控制，简化了大规模时间序列数据的存储和查询。由于数据流的后端索引是隐藏的，直接管理这些索引的权限是不现实的。对于数据流，这些权限同样适用。当您授予用户对数据流的某种权限时，Elasticsearch 会自动将这些权限映射到数据流的后端索引。• 权限的粒度：虽然数据流的权限会映射到后端索引，但您仍然可以通过更细粒度的权限控制（如字段级权限）来进一步限制用户对数据的访问。

Elasticsearch：Data streams（三）

Elastic 中国社区官方博客

11-22

1685

这是一个系列文章的第三篇文章。在今天的文章中，我将详述如何修改 data strram 的 mappings 以及它的设置。每个数据流都有一个匹配的。此模板中的映射和索引设置应用于为流创建的新后备索引。这包括流的第一个后备索引，它是在创建流时自动生成的。在创建数据流之前，我们建议你仔细考虑要在此模板中包含哪些映射（mappings）和设置（settings）。：如果你的更改包括对现有字段映射或的修改，则通常需要重建索引以将更改应用到数据流的后备索引。

【Elasticsearch】Data Streams

risc123456的博客

03-03

642

• 索引生命周期管理（ILM）集成：Data Streams 与 ILM（Index Lifecycle Management）紧密集成，可以自动化管理后端索引的生命周期，例如根据索引的大小或年龄自动滚动（rollover）到新的索引，或者将旧索引移动到低成本存储。• 索引模板（Index Template）：每个 Data Stream 都需要一个匹配的索引模板，用于定义后端索引的映射（mappings）和设置（settings）。滚动操作会创建一个新的后端索引，并将其设置为新的写入索引。

Elasticsearch数据流(Data Stream)使用指南

gitblog_00911的博客

05-30

461

数据流(Data Stream)是Elasticsearch中一种特殊的数据结构，专为时间序列数据设计。它由多个隐藏的索引(称为后备索引)组成，这些索引按时间顺序排列，形成一个逻辑上的连续数据流。数据流简化了时间序列数据的管理，自动处理索引的生命周期，非常适合日志、指标等时序数据的存储和分析。 ## 数据流的基本操作 ### 添加文档到数据流向数据流添加文档有两种主要方式： 1. **单...

Elasticsearch logstash 输出到elasticsearch的data stream