
Doris中的优化涉及到的方面非常多,例如在分区、分桶、join、查询、参数等各个方面都有优化对应策略,具体可以参考前面每个部分内容,这里大体总结下Doris中的优化相关内容:
- 执行SQL慢可以通过Doris提供的QueryProfile查看SQL执行的统计信息帮助我们了解Doris的执行情况,并有针对性的进行相应Debug与调优工作。具体可以参考https://doris.apache.org/zh-CN/docs/dev/admin-manual/query-profile。
- 在Doris中选择合适的数据存储模型来存储数据,针对不同场景选择AGGREGATE KEY, UNIQUE KEY, DUPLICATE KEY 三种数据存储模型
- 创建Doris表时设置合理的分区和分桶个数,方便对数据进行管理,在企业生产环境中也可以设置Doris分级存储(SSD + SATA)提高数据管理。
- Doris建表时,建议采用区分度大的列做分桶, 避免出现数据倾斜,为方便数据恢复, 建议单个 b
本文总结了Apache Doris的优化策略,包括选择合适的数据存储模型、设置合理的分区和分桶、利用索引和物化视图加速查询、优化Join操作、避免直接删除数据以及使用缓存提高查询效率。建议使用JDBC而非ODBC查询外部数据库,以及在构建表时采用星型模型以提升Join性能。
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



