clickhouse-配置解释

最新推荐文章于 2025-09-27 21:00:41 发布

原创

最新推荐文章于 2025-09-27 21:00:41 发布 · 3.4k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#clickhouse

本文围绕ClickHouse展开，介绍了全局服务配置，包括interserver_http_credentials示例、zookeeper配置模版等，还阐述了query - level的变量配置，如多种配置和查询方法，包括创建用户时设置、通过配置文件指定等，具体配置可参考官方文档。

详细内容看官网文档

一、全局服务配置

1.配置详解

名称	含义	默认值
allow_use_jemalloc_memory	允许使用 jemalloc 内存	1（布尔）
asynchronous_heavy_metrics_update_period_s	更新异步指标的时间段（以秒为单位）	120
asynchronous_metrics_update_period_s	更新异步指标的时间段（以秒为单位）	1
background_buffer_flush_schedule_pool_size	将用于在后台对缓冲区引擎表执行刷新操作的最大线程数	16
background_common_pool_size	将用于在后台对 *MergeTree 引擎表执行各种操作（主要是垃圾回收）的最大线程数	8
background_distributed_schedule_pool_size	将用于执行分布式发送的最大线程数	16
background_fetches_pool_size	将用于从后台 *MergeTree 引擎表的另一个副本获取数据部分的最大线程数	8
background_merges_mutations_concurrency_ratio	设置线程数与可以同时执行的后台合并和突变数之间的比率。例如，如果比率等于2并且background_pool_size设置为16，那么ClickHouse可以同时执行32个后台合并。这是可能的，因为后台操作可以暂停和推迟。这是为小型合并提供更多执行优先级所必需的。您只能在运行时增加此比率。要降低它，您必须重新启动服务器。与background_pool_size设置相同的background_merges_mutations_concurrency_ratio可以从默认配置文件中应用以实现向后兼容性。	2(float)
background_merges_mutations_scheduling_policy	关于如何执行后台合并和突变调度的策略。可能的值为：round_robin 和shortest_task_first round_robin — 每个并发合并和变异都按循环顺序执行，以确保无饥饿操作。较小的合并比较大的合并完成得更快，因为它们需要合并的块较少。 shortest_task_first — 始终执行较小的合并或突变。合并和突变根据其结果大小分配优先级。较小尺寸的合并优先于较大尺寸的合并。此策略可确保以最快的速度合并小部分，但可能会导致 INSERT 严重过载的分区中的大合并无限期匮乏。	round_robin
background_message_broker_schedule_pool_size	将用于执行消息流的后台操作的最大线程数	16
background_move_pool_size	将用于将数据部分移动到后台 *MergeTree 引擎表的另一个磁盘或卷的最大线程数	8
background_pool_size	设置使用 MergeTree 引擎对表执行后台合并和突变的线程数。您只能在运行时增加线程数。要减少线程数，您必须重新启动服务器。通过调整此设置，您可以管理 CPU 和磁盘负载。较小的池大小使用较少的 CPU 和磁盘资源，但后台进程进展较慢，最终可能会影响查询性能。在更改之前，还请查看相关的 MergeTree 设置，例如 number_of_free_entries_in_pool_to_lower_max_size_of_merge 和 number_of_free_entries_in_pool_to_execute_mutation。	16
background_schedule_pool_size	将用于不断对复制表、Kafka 流式处理和 DNS 缓存更新执行某些轻量级定期操作的最大线程数。	128
backup_threads	执行备份请求的最大线程数	16
backups_io_thread_pool_queue_size	备份 IO 线程池上可以调度的最大作业数。由于当前的 S3 备份逻辑，建议保持此队列不受限制 (0)。	0
cache_size_to_ram_max_ratio	将缓存大小设置为 RAM 最大比率。允许降低低内存系统上的缓存大小	0.5
concurrent_threads_soft_limit_num	允许运行所有查询的最大查询处理线程数（不包括用于从远程服务器检索数据的线程）。这不是硬性限制。万一达到限制，查询仍将至少有一个线程运行。如果有更多线程可用，查询可以在执行期间扩展到所需的线程数。	0
concurrent_threads_soft_limit_ratio_to_cores	与 concurrent_threads_soft_limit_num 相同，但具有与核心的比率。	0
default_database	默认数据库名称	default
disable_internal_dns_cache	禁用内部 DNS 缓存。建议在基础设施经常变化的系统（例如 Kubernetes）中运行 ClickHouse。	0（布尔）
dns_cache_update_period	内部 DNS 缓存更新周期（以秒为单位）	15
dns_max_consecutive_failures	从 ClickHouse DNS 缓存中删除主机之前的最大连续解析失败次数	1024
index_mark_cache_size	索引标记的缓存大小。零表示禁用此设置可以在运行时修改，并将立即生效。	0
index_uncompressed_cache_size	合并树索引的未压缩块的缓存大小。零表示禁用此设置可以在运行时修改，并将立即生效	0
io_thread_pool_queue_size	IO 线程池的队列大小。零表示无限制。	10000
mark_cache_policy	标记缓存策略名称	SLRU
mark_cache_size	标记的缓存大小（合并树系列表的索引）此设置可以在运行时修改，并将立即生效	5368709120
max_backup_bandwidth_for_server	服务器上所有备份的最大读取速度（以字节/秒为单位）。零表示无限制	0
max_backups_io_thread_pool_free_size	如果Backups IO Thread池中的空闲线程数量超过max_backup_io_thread_pool_free_size，ClickHouse将释放空闲线程占用的资源并减小池大小。如果需要，可以再次创建线程。	0
max_backups_io_thread_pool_size	用于备份查询的 IO 操作的最大线程数	1000
max_concurrent_queries	并发执行查询总数的限制。零意味着无限。请注意，还必须考虑对插入和选择查询以及用户最大查询数的限制。另请参见 max_concurrent_insert_queries、max_concurrent_select_queries、max_concurrent_queries_for_all_users。零意味着无限。此设置可以在运行时修改，并将立即生效。已在运行的查询将保持不变。	0
max_concurrent_insert_queries	并发插入查询总数的限制。零表示无限制此设置可以在运行时修改，并将立即生效。已在运行的查询将保持不变	0
max_concurrent_select_queries	限制并发选择查询的总数。零表示无限制。此设置可以在运行时修改，并将立即生效。已在运行的查询将保持不变	0
max_connections	最大服务器连接数	1024
max_io_thread_pool_free_size	IO 线程池的最大可用大小	0
max_io_thread_pool_size	将用于 IO 操作的最大线程数	100
max_local_read_bandwidth_for_server	本地读取的最大速度（以字节/秒为单位）。零表示无限制	0
max_local_write_bandwidth_for_server	本地写入的最大速度（以字节/秒为单位）。零表示无限制	0
max_partition_size_to_drop	限制删除分区。如果 MergeTree 表的大小超过 max_partition_size_to_drop （以字节为单位），则无法使用 DROP PARTITION 查询删除分区。此设置不需要重新启动 Clickhouse 服务器即可应用。禁用限制的另一种方法是创建 /flags/force_drop_table 文件。值 0 表示您可以不受任何限制地删除分区。	50GB
max_remote_read_network_bandwidth_for_server	通过网络进行数据交换的最大速度，以字节/秒为单位进行读取。零表示无限制	0
max_remote_write_network_bandwidth_for_server	通过网络进行写入的数据交换的最大速度（以字节/秒为单位）。零表示无限制	0
max_server_memory_usage	总内存使用量限制。零意味着无限。默认 max_server_memory_usage 值的计算方式为：memory_amount * max_server_memory_usage_to_ram_ratio。	0
max_table_size_to_drop	删除表的大小限制	50GB
max_temporary_data_on_disk_size	可用于外部聚合、联接或排序的最大存储量。超过此限制的查询将失败并出现异常。零意味着无限。另请参阅 max_temporary_data_on_disk_size_for_user 和 max_temporary_data_on_disk_size_for_query。	0
max_thread_pool_free_size	如果全局线程池中的空闲线程数大于 max_thread_pool_free_size，则 ClickHouse 会释放部分线程占用的资源，并减小池大小。如果需要的话可以再次创建线程	1000
max_thread_pool_size	可以从操作系统分配并用于查询执行和后台操作的最大线程数	10000
mmap_cache_size	设置映射文件的缓存大小（以字节为单位）。此设置可以避免频繁的打开/关闭调用（由于随之而来的页面错误，这非常昂贵），并可以重用来自多个线程和查询的映射。设置值为映射区域的数量（通常等于映射文件的数量）。可以使用 MMappedFiles 和 MMappedFileBytes 指标在表 system.metrics 和 system.metric_log 中监视映射文件中的数据量。此外，在 system.asynchronous_metrics 和 system.asynchronous_metrics_log 中通过 MMapCacheCells 指标，在 system.events、system.processes、system.query_log、system.query_thread_log、system.query_views_log 中通过 CreatedReadBufferMMap、CreatedReadBufferMMapFailed、MMappedFileCacheHits、MMappedFileCacheMisses 事件。请注意，映射文件中的数据量不会直接消耗内存，并且不会计入查询或服务器内存使用量中，因为该内存可以像操作系统页面缓存一样被丢弃。在删除 MergeTree 系列表中的旧部分时，缓存会自动删除（文件被关闭），也可以通过 SYSTEM DROP MMAP CACHE 查询手动删除。此设置可以在运行时修改	1000
restore_threads	执行还原请求的最大线程数	16
show_addresses_in_stack_traces	如果设置为 true，将在堆栈跟踪中显示地址	1(布尔)
shutdown_wait_unfinished_queries	如果设置为 true，ClickHouse 将等待运行查询完成，然后再关闭。	0（布尔）
temporary_data_in_cache	使用此选项，临时数据将存储在特定磁盘的缓存中。在本节中，您应该指定具有类型缓存的磁盘名称。在这种情况下，缓存和临时数据将共享相同的空间，并且可以逐出磁盘缓存以创建临时数据。只能使用一个选项来配置临时数据存储：tmp_path、tmp_policy、temporary_data_in_cache。
thread_pool_queue_size	全局线程池上可以调度的最大作业数。增加队列大小会导致更大的内存使用量。建议将此值保持等于 max_thread_pool_size。零意味着无限。	10000
tmp_policy	包含临时数据的存储策略只能使用一个选项来配置临时数据存储：tmp_path、tmp_policy、temporary_data_in_cache。 move_factor、keep_free_space_bytes、max_data_part_size_bytes 和被忽略。策略应该只有一个带有本地磁盘的卷。
uncompressed_cache_policy	未压缩的缓存策略名称	SLRU
uncompressed_cache_size	合并树系列中的表引擎使用的未压缩数据的高速缓存大小（以字节为单位）。零表示禁用。服务器有一个共享缓存。内存按需分配。如果启用了选项 use_uncompressed_cache，则使用缓存。在个别情况下，未压缩的缓存对于非常短的查询是有利的。此设置可以在运行时修改，并将立即生效	0
builtin_dictionaries_reload_interval	重新加载内置词典之前的间隔（以秒为单位）。ClickHouse每x秒重新加载一次内置词典。这样就可以“动态”编辑词典，而无需重新启动服务器	3600
compression	合并树引擎表的数据压缩设置,如果您刚刚开始使用ClickHouse，请不要使用它。 case内容如下： min_part_size – 数据部分的最小大小。 min_part_size_ratio – 数据部分大小与表大小的比率。 method——压缩方法。可接受的值：lz4、lz4hc、zstd、deflate_qpl。 level – 压缩级别。
encryption	配置命令以获取加密编解码器使用的密钥。密钥（或多个密钥）应写入环境变量或在配置文件中设置。密钥可以是十六进制或长度等于 16 字节的字符串。
custom_settings_prefixes	自定义设置的前缀列表。前缀必须用逗号分隔。
core_dump	配置核心转储文件大小的软限制	1073741824 (1 GB)
database_atomic_delay_before_drop_table_sec