亲爱的社区小伙伴们,Apache Doris 2.1.5 版本已于 2024 年 7 月 24 日正式发布。2.1.5 版本在湖仓一体、多表物化视图、半结构化数据分析等方面进行了全面更新及改进,同时在倒排索引、查询优化器、查询引擎、存储管理等 10 余方向上完成了若干问题修复,欢迎大家下载使用。
官网下载:https://doris.apache.org/
GitHub 下载:https://github.com/apache/doris/releases/tag/2.1.5-rc02
行为变更
- JDBC Catalog 的默认连接池大小从 10 调整为 30。#37023
- 创建 JDBC Catalog 时,参数
connection_pool_max_size的默认值改为 30,以避免高并发场景下连接池耗尽的问题。 - 将系统的保留内存的最小值,即
low water mark调整为 min (6.4G, MemTotal * 5%),以更好地防止 BE 出现 OOM 问题。 - 修改了单请求多个语句的处理逻辑,当客户端未设置
CLIENT_MULTI_STATEMENTS标志位时,将仅返回最后一个语句的结果,而非所有语句结果。 - 不再允许直接更改异步物化视图的数据。#37129
- 增加会话变量
use_max_length_of_varchar_in_ctas,用于控制 CTAS 时 VARCHAR 和 CHAR 类型长度的生成行为。默认值是 true。当设置为 false 时,使用推导出的 VARCHAR 长度,而不是使用最大长度。#37284 - 统计信息收集,默认开启了通过文件大小预估 Hive 表行数的功能。#37694
- 默认开启异步物化视图透明改写机制。#35897
- 透明改写利用分区物化视图,如果分物物化视图部分分区失效,默认行为是将所有基础表与物化视图联合,以保证查询数据的正确性。 #35897
新功能
湖仓一体
- 会话变量
read_csv_empty_line_as_null用于控制在读取 CSV 格式文件时,是否忽略空行。默认情况下忽略空行,当设置为 true 时,空行将被读取为所有列均为 Null 的行。#37153 - 新增兼容 Presto 的复杂类型输出格式。通过设置
set serde_dialect="presto",可以控制复杂类型的输出格式 与 Presto 一致,用于平滑迁移 Presto 业务。#37253
多表物化视图
- 支持在构建物化视图中使用非确定性函数。#37651
- 支持原子替换异步物化视图定义。#37147
- 支持通过
show create materialized view查看异步物化视图创建语句。 #37125 - 支持对多维聚合查询的透明改写。#37436
- 支持对非聚合物化视图的聚合查询进行透明改写。 #37497
- 支持使用 Key 列,对查询中的 DISTINCT 聚合做透明改写。#37651
- 支持对物化视图进行分区,通过使用
date_trunc对分区进行汇总。#31812 #35562 - 支持分区表值函数(TVF) #36479
半结构化数据分析
- 使用 VARIANT 类型的表支持部分列更新。 #34925
- 支持默认开启 PreparedStatement。 #36581
- VARIANT 类型支持导出为 CSV 格式。#37857
- 支持
explode_json_object函数,用于将 JSON Object 行转列。 #36887 - ES Catalog 将 ES 的 NESTED 或者 OBJECT 类型映射成 Doris JSON 类型。#37101
- 默认情况下,对于具有指定分词器的倒排索引,默认开启
support_phrase以提升match_phrase系列查询性能。#37949

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



