在全球 290 位开发者的协作下,Apache Doris 在 2024 年完成了 7000+ 次代码提交,并发布了 22 个版本,实现在实时分析、湖仓一体和半结构化数据分析等核心场景的技术突破及创新。
2025 年,Apache Doris 社区将秉承“以场景驱动创新” 的核心理念,持续深耕三大核心场景的关键能力,并对大模型 GenAI 场景的融合应用进行重点投入,为智能时代构建实时、高效、统一的数据底座。
全部规划可见:Apache Doris Roadmap 2025

Apache Doris 2024 Review
回顾 2024 年,Apache Doris 重点聚焦于全面提升实时分析、湖仓融合分析、日志分析在实际应用场景中的效能,可将核心工作归纳为以下五个方面:
查询优化方面
- 优化器新增了多项优化规则,实现了统计信息的高效自动收集,具备了自适应执行并发度的能力。
- 在物化视图的构建以及透明改写方面,投入大量精力深入优化,极大提升查询效率。
- 对 ARM 架构包含 AWS Graviton 处理器、华为鲲鹏处理器进行深入性能优化。
存储优化方面
- 持续提升导入稳定性,尤其在高并发、小批量以及 Routine Load 的健壮性等方面。
- 探索更为复杂的数据处理场景,如对多语句事务的支持等。
半结构化分析方面
- 提升 VARIANT 数据类型成熟度,成为业界最高效的 JSON 格式数据处理方案。
- 日志存储与分析场景的用户量增长迅猛,有上百家中大型企业用户采用 Doris 替换 Elasticsearch、Clickhouse、Loki 来应对日志场景。
Lakehouse 湖仓分析方面
- 作为 Doris 重点支持的场景之一,2024 年针对 Hive、Iceberg、Hudi、Paimon 进行了大量兼容和深度优化工作,性能和稳定性有明显提升。
- 进一步完善 SQL 方言的兼容支持,以便于用户能够实现平滑迁移,在多个大型用户实际场景中,兼容性高达 99%以上。
云原生存算分离方面
- 在 3.0 版本中,Doris 全面支持了存算分离架构,将云原生理念引入开源社区,进一步增强了无服务化以及按需弹性场景的支持能力 。
2024 年除了新功能的开发和架构性能优化,我们也花费大量时间进行质量保障,包含深入 Reivew 之前的功能设计,以确保稳定性及可扩展性;大量的黑盒、白盒测试;仿生产系统长稳压测;混沌测试等。我们希望在保持 Doris 创新力的同时,依然能够更加聚焦在 Doris 核心功能与稳定性上,确保用户、客户能够获得真正的收益和价值。
Apache Doris 2025 Roadmap
2025 年,社区将秉承“以场景驱动创新” 的核心理念,持续深耕三大核心场景的关键能力,并对大模型 GenAI 场景的融合应用进行重点投入,为智能时代构建更

最低0.47元/天 解锁文章
1161

被折叠的 条评论
为什么被折叠?



