文档地址: StarRocks @ StarRocks_intro
StarRocks版本:2.2
StarRocks介绍
- StarRocks是新一代极速全场景MPP数据库。
- StarRocks充分吸收关系型OLAP数据库和分布式存储系统在大数据时代的优秀研究成果,在业界实践的基础上,进一步改进优化、升级架构,并增添了众多全新功能,形成了全新的企业级产品。
- StarRocks致力于构建极速统一分析体验,满足企业用户的多种数据分析场景,支持多种数据模型(明细模型、聚合模型、更新模型),多种导入方式(批量和实时),支持导入多达10000列的数据,可整合和接入多种现有系统(Spark、Flink、Hive、 ElasticSearch)。
- StarRocks兼容MySQL协议,可使用MySQL客户端和常用BI工具对接StarRocks来进行数据分析。
- StarRocks采用分布式架构,对数据表进行水平划分并以多副本存储。集群规模可以灵活伸缩,能够支持10PB级别的数据分析; 支持MPP框架,并行加速计算; 支持多副本,具有弹性容错能力。
- StarRocks采用关系模型,使用严格的数据类型和列式存储引擎,通过编码和压缩技术,降低读写放大;使用向量化执行方式,充分挖掘多核CPU的并行计算能力,从而显著提升查询性能。
从用途上来说,StarRocks可用于海量数据的高速查询场景,并兼容MySQL协议。
快速开始
StarRocks 基本概念及系统架构
StarRocks架构图
StarRocks集群由前端节点(FrontEnd,简称FE)、后端节点(BackEnd,简称BE)组成。类似Spark集群的master-slave架构。
手动部署
这一节可以忽略,一般会有专门的