Elasticsearch 的Data Stream Lifecycle Settings(数据流生命周期设置)是一组用于管理和优化数据流(Data Streams)的配置选项。这些设置通过定义数据流的保留策略、滚动条件、合并策略等,帮助用户自动化数据流的生命周期管理,从而提高数据的可维护性和存储效率。以下是结合翻译内容对这些设置的详细说明:
---
1.数据流生命周期设置的总体目标
数据流生命周期设置旨在自动化和优化数据流的管理过程。通过配置这些设置,用户可以:
• 控制数据的保留时间,避免数据无限增长。
• 自动触发数据流的滚动(rollover),在达到一定条件时创建新的索引。
• 优化索引的合并策略,减少存储空间的浪费。
• 确保数据流的健康状态,避免因错误而卡住。
---
2.集群级设置(Cluster-level Settings)
集群级设置是全局性的,适用于所有由数据流生命周期管理的数据流。这些设置包括:
`data_streams.lifecycle.retention.max`
• 描述:定义所有数据流的最大保留期限。如果数据流的配置保留时间超过此值,将被覆盖。
• 默认值:无默认值,必须手动设置。
• 要求:必须大于`10s`。
• 作用:防止数据流的保留时间过长,从而节省存储空间。
`data_streams.lifecycle.retention.default`
• 描述:为未显式配置保留时间的数据流提供默认保留期限。