Apache Doris 2.0.0 特性分析

本文介绍了Doris2.0版本的新特性,包括存算分离的原理与限制,多源数据目录(Multi-Catalog)的管理优势,冷热分层用于数据存储和查询效率提升,以及新优化器Nereids和pipeline执行器的应用。

1、存算分离 所谓存算分离是指查询外表时,使用一种专门做计算的BE节点,但对于存储在BE上的内部表,目前还不能做到存储分离。 doris可以查询外部表,包括: Hive、Iceberg、Hudi、Elasticsearch、JDBC、Paimon 早期版本中,FE通过BE节点查询外部表,并且在BE节点内执行join、sort、agg等计算, 这些BE节点同时也负责doris的内部表的存储和计算, 新版本改造了BE节点,通过修改配置,它可以仅用于查询外表时的计算,内部表数据不会存到它上面, 这种BE称为“计算节点”,而既存储内部表数据又执行计算的BE节点称为“混合节点”。 两者的代码和二进制安装文件是一样的,只是配置不同,在集群中扮演的角色不同。 配置方法如下: 修改FE的配置文件: prefer_compute_node_for_external_table=true min_backend_num_for_external_table=3 修改BE配置: be_node_role=computation 然后将这个BE加入集群: ALTER SYSTEM ADD BACKEND "be_ip:be_port"; 可以如此加入多个“计算节点”。

当集群中有充足的计算节点时,当FE查询外表时,执行计划优先下发给“计算节点”,而不发给“混合节点”。

以上就是2.0.0存算分离特性的原理和状态,以下是这一特性的限制和理解上的澄清: 目前访问外部表(无论是否使用存算分离)只支持读取,不能写入。 存算分离的计算节点,只能用于外表的访问和计算,对内部表算子(例如JOIN、AGG、SORT)还不能调度到计算节点执行, 可能以后版本会支持,这个称为“计算外溢”。 SelectDB在apache doris官网上说,2023年10月会上传更成熟的存算分离架构给社区,估计目前的存算分离还不够完善。 查看了一下StarRocks的官网,没有存算分离的文档,只有3.1的release note提了一下。

2、多源数据目录(Multi-Catalog) 这是一种管理外部数据源更好的模型,数据库层级的模型: Catalog -- 可以理解为一个种类型的数据库集群,里面包含多个同一类型的数据库。 Database -- 用于数据管理的隔离,有

### Apache Doris 单机部署教程 #### 准备工作 为了成功安装和运行最新版本的 Apache Doris,需确保服务器满足最低硬件需求并已安装必要的软件环境。建议的操作系统为 Linux 或 macOS。 #### 下载 Apache Doris 访问官方下载页面获取最新的稳定版二进制包[^1]。选择适合操作系统的压缩包进行下载。通常情况下,Linux 用户会选择 tar.gz 格式的文件。 ```bash wget https://downloads.apache.org/doris/apache-doris-2.0.0-bin.tar.gz tar zxvf apache-doris-2.0.0-bin.tar.gz -C /opt/ cd /opt/apache-doris-2.0.0/ ``` #### 修改配置文件 进入解压后的目录结构中的 `be/conf` 和 `fe/conf` 文件夹分别编辑 Backend (BE) 及 Frontend (FE) 的配置文件[^4]: 对于 BE 节点: ```bash cd /opt/apache-doris-2.0.0/fe/conf/ nano fe.conf ``` 设置合适的 JVM 参数和其他选项来优化性能表现;同样地处理 FE 配置文件。 对于 FE 节点: ```bash cd /opt/apache-doris-2.0.0/be/conf/ nano be.conf ``` 调整内存分配以及其他参数以适应具体应用场景的需求。 #### 启动服务 完成上述准备工作之后就可以启动各个组件的服务进程了。先启动 FE 组件再启动 BE 组件可以保证集群正常初始化。 ```bash # Start FE service /opt/apache-doris-2.0.0/fe/bin/start_fe.sh --daemon # Wait until the FE is fully started, then start BE services. sleep 30s # Start BE service /opt/apache-doris-2.0.0/be/bin/start_be.sh --daemon ``` 此时应该可以通过浏览器或其他客户端工具连接至默认监听端口9030上的 MySQL 接口来进行 SQL 查询测试。 #### 测试验证 通过命令行或者其他图形界面SQL客户端尝试执行简单的查询语句确认安装是否成功以及基本功能能否正常使用。 ```sql mysql -h127.0.0.1 -P9030 -uroot show databases; use test_db; create table t(a int); insert into t values(1),(2),(3); select * from t; ``` 如果一切顺利,则说明单节点模式下的 Apache Doris 已经被正确设置了!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值