doris是个啥?
Doris 是一款基于 MPP 技术的SQL分析型数据库系统,能够在海量数据的 OLAP 场景下提供毫秒级的查询响应性能。Doris 的实现架构脱胎自 Apache Impala 和 Google Mesa 系统,并进行了大量的改造和优化,最终形成了今天大家看到的这款架构优雅、性能卓越、功能丰富、简单易用的 OLAP 数据库系统。
doris有什么特点?
- MPP架构的分析型数据库
- 毫秒级别的响应速度
- 支持标准的SQL(兼容Mysql协议)
- 丰富的聚合模型,以及聚合表技术
- Rollup等预聚合技术
- 运维简单,弹性伸缩
- 高可用、高可靠
- 丰富的周边生态工具
- 向量化执行器
doris能干什么?
1、对数据分析、统计
数据分析大体上可以分为两大类场景:一种偏向于报表类的,另一种偏向于多维分析的。
2、报表
报表类数据分析,数据分析以及查询的模式相对比较固定,而且后台 SQL 的模式往往都是确定的。针对此类应用场景,选择使用 MySQL 存结果数据,用户可从界面选择执行批处理以及发送邮件。在 Doris 平台中,报表类查询时延一般在秒级以下。
3、多维分析
这里提到的多维分析,同样要求数据是结构化的,适用于查询相对灵活的场景,例如数据分析条件以及聚合维度等方面不是很确定,一般将此类数据分析定义为多维分析。相对于报表类分析,多维分析的查询时延会稍慢,大约在会在 10s 的级别。
doris架构由有哪些角色?
- Frontend:前端节点,接收客户端的请求,负责查询解析、路由和负载均衡等工作。
Backend:后端节点,负责数据存储、计算和查询等工作,可以水平扩展。
Namenode:元数据节点,负责管理集群的元数据信息,例如表结构、分区信息等。
Broker:代理节点,负责处理跨集群的查询请求,可以与其他集群进行数据交互。
Statestore:状态节点,负责管理集群的状态信息,例如节点状态、负载均衡信息等。
这些角色共同组成了Apache Doris的分布式架构,支持高可用、高性能和高扩展性。