了解篇 | StarRocks 是个什么数据库？

原创于 2025-09-15 17:51:26 发布 · 989 阅读

CC 4.0 BY-SA版权

文章标签：

今天简要介绍一下StarRocks 这个强大的数据库。

注意：本文章内容仅供个人学习，不包含任何推荐性质。

StarRocks（原名 Doris）是一个高性能、全场景的MPP（大规模并行处理）分析型数据库。它专为极速的多维联机分析处理（OLAP）而设计，能够对海量数据进行实时和批量的多维分析、即席查询和高并发报表。

官方网站获取文档和下载：https://www.starrocks.io

一、特性与优势

1. 性能

2. 实时分析

支持实时数据导入，数据写入后立即可查。它支持从多种数据源（如Kafka、Flink、Spark等）通过物化视图（Materialized View）和 Bitmap 索引等技术进行预聚合和加速，使得即使在大数据量下，聚合查询也能在亚秒级返回。

3. 高并发

架构设计上避免了外部系统依赖（如ZooKeeper），并进行了大量优化，能够支持数千甚至上万的高并发查询，非常适合作为企业统一的分析门户或数据中台的查询引擎。

4.全面兼容 MySQL 协议

支持标准SQL-92，并且兼容MySQL网络协议。这意味着你可以使用任何常见的MySQL客户端、BI工具（如Tableau、Superset、FineBI）或应用程序直接连接StarRocks，学习成本和迁移成本极低。

5. 物化视图

用户可以在基表上创建多个物化视图。StarRocks的优化器能够自动、智能地选择最优的物化视图来响应查询，无需在查询语句中显式指定，对应用透明，极大地加速了聚合查询。

6. 易于运维

提供简洁的前端（FE）和后台（BE）架构，部署和运维相对简单。

支持在线弹性扩缩容，可通过简单的SQL命令添加或删除节点，集群会自动进行数据重分布。

二、技术架构

StarRocks 采用了一个非常简洁的架构，主要由两个角色组成：

1. Frontend (FE)

职责：负责元数据管理、客户端连接管理、查询规划与调度。

组件：

nLeader FE：主节点，负责元数据的写入和日志。

nFollower FE：从节点，参与选举，提供元数据读取服务。

nObserver FE：观察者节点，仅扩展元数据的读取能力，不参与选举。

通常通过BDB JE进行Leader和Follower之间的元数据同步。

2. Backend (BE)

职责：负责数据存储和查询执行。每个BE节点存储一部分数据（Tablet），并执行FE下发的查询任务。

数据分片：表的数据被水平分区为多个Tablet，每个Tablet有多个副本（通常为3），分布在不同BE上，保证了高可用和高性能。

三、适用场景：

实时数据看板与BI报表：为业务人员提供高并发的自助分析平台。
用户行为分析：支持对海量用户数据进行多维度、即席的探查与分析。
日志分析：替代ELK等方案，进行结构化的日志存储与查询。
统一查询入口（数据网关）：通过External Table功能，可以直接查询Hive、Iceberg、Hudi、Elasticsearch等外部数据源，无需数据导入，实现“湖仓一体”分析。
高并发精准查询：例如电商的订单查询、用户画像的标签查询等。

四、与其他OLAP数据库的对比