1. 高性能
- 1.基于MPP架构:Doris采用大规模并行处理(MPP)架构,能够将数据和计算任务分布到多个节点上并行处理,充分利用集群的计算资源,大大提升查询处理的效率。
- 2.向量化执行引擎:采用向量化执行技术,以批量数据处理代替传统的行式处理方式,显著提升了数据处理的速度,尤其在处理复杂查询时优势明显。
- 3.列存储:数据以列的形式存储,这对于OLAP场景非常友好,减少了I/O开销,同时有利于数据的压缩,进一步提高存储效率和查询性能。
2. 高可用性
- 1.FE节点高可用性:FE节点可以部署多个,通过选举机制产生一个主节点和多个从节点。主节点负责处理写操作和元数据的变更,从节点负责同步主节点的元数据,并处理读请求。当主节点出现故障时,从节点会自动选举出新的主节点,确保系统的高可用性。
- 2.数据自动均衡:Doris支持数据自动均衡功能,确保数据在各节点间均匀分布,从而提升查询性能和资源利用率。
3. 高扩展性
- 1.水平扩展:无论是FE节点还是BE节点,都可以轻松地进行水平扩展。这使得Doris可以根据业务数据量的增长和查询负载的增加,灵活地扩展集群规模,保证系统的性能和可用性。
- 2.存算分离支持:在3.0版本中引入了存算分离,可以通过多计算集群实现查询负载间的物理隔离以及读写负载隔离,计算和存储资源可以独立扩展,进一步提升了系统的灵活性和性能。
4. 实时性
- 1.实时数据摄入:Doris支持实时数据摄入,用户可以通过多种方式将实时产生的数据快速导入到Doris中。
- 2.实时查询:支持实时查询分析,满足对实时性要求较高的业务场景,如实时报表、实时监控等。
5. 易用性
- 1.标准SQL接口:Doris提供了标准的SQL接口,兼容MySQL协议,方便集成和使用。
- 2.图形化管理界面:通过图形化管理界面简化集群管理和监控。
- 3.丰富的连接器:Doris提供了丰富的连接器,可以无缝对接Hive、Iceberg、Hudi、Paimon等数据源。
6. 支持复杂SQL分析
- 1.Doris凭借完善的MPP执行框架和向量化执行引擎,在复杂SQL分析上表现优秀。特别是对于多表Join,Doris支持大表间的shuffle join,能够处理复杂的分析查询。
7. 多种数据模型
- 1.Doris支持多种数据模型,包括明细模型、聚合模型和更新模型(主键模型),以满足不同业务场景的需求。
8. 高效的聚合表技术
- 1.Doris提供了高效的聚合表技术,如Rollup,可以预先对数据进行聚合,从而提高查询性能。
9. 轻量级元数据变更
- 1.Doris支持轻量级的元数据变更操作,如更改列名、增加或删除值列,以及调整Varchar列的长度等。这些操作可在毫秒级别内完成,确保数据能够实时更新。