OLAP数仓高手
文章平均质量分 96
OLAP数据分析深度解析
程序员1970
原名:[码到三十五],公众号:[程序员1970]
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
OceanBase 列存的现在与未来
OceanBase 4.3 正式推出列存功能,打造满足实时分析业务的列存能力。本文将作为《列存能力深入剖析解读》的延伸,进一步探讨列存在 OceanBase 数据库架构中应用和演进,以及未来的发展方向。原创 2024-07-07 23:29:31 · 5252 阅读 · 79 评论 -
Facebook数据仓库的变迁与启示
Facebook的数据仓库变迁历程为我们提供了宝贵的经验和启示。随着技术的不断进步,我们有理由相信,未来的数据仓库将更加智能、高效和稳定。同时,企业应根据自身业务需求,借鉴Facebook的策略,构建适合自己的数据仓库架构。本文内容基于徐文浩在《大数据经典论文解读》的讲解,结合Facebook在不同发展阶段的数据仓库策略进行分析和总结。希望对正在构建或优化大数据系统的企业和技术人员有所帮助。关注公众号获取更多技术干货!原创 2024-07-07 17:03:02 · 1958 阅读 · 11 评论 -
OLAP数据库选型指南:Doris与ClickHouse的深入对比与分析
Doris和ClickHouse都是优秀的数据处理和分析工具,具有出色的性能和功能。在选择时,需要根据实际需求进行性能测试、功能对比、易用性评估和社区支持考察。同时,还需要考虑具体的应用场景和数据特点,选择最适合的技术方案。原创 2024-03-21 08:30:00 · 8332 阅读 · 154 评论 -
RocksDB:高性能键值存储引擎初探
在现代的分布式系统和大数据应用中,一个高效、可靠的存储引擎是不可或缺的。RocksDB,由Facebook于2012年开发并随后开源,正是为了满足这类需求而诞生的。它是一个持久化的键值存储系统,特别适合在闪存(Flash)和高速硬盘上使用。RocksDB的设计目标是在提供快速、低延迟存储访问的同时,保持高度的可靠性和可扩展性原创 2024-02-14 05:42:34 · 1794 阅读 · 0 评论 -
深入解析实时数仓Doris:三大数据模型详解
在 Doris 中,数据以表(Table)的形式进行逻辑上的描述。 一张表包括行(Row)和列(Column)。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。Column 可以分为两大类:Key 和 Value。从业务角度看,Key 和 Value 可以分别对应维度列和指标列。Doris 的 key 列是建表语句中指定的列,建表语句中的关键字'unique key'或'aggregate key'或'duplicate key'后面的列就是 Key 列,除了 Key 列剩下的就是原创 2024-03-29 11:11:51 · 4404 阅读 · 61 评论 -
深入解析实时数仓Doris:Rollup上卷表与查询
在 Doris 中,我们将用户通过建表语句创建出来的表称为 Base 表(Base Table)。Base 表中保存着按用户建表语句指定的方式存储的基础数据。在 Base 表之上,我们可以创建任意多个 ROLLUP 表。这些 ROLLUP 的数据是基于 Base 表产生的,并且在物理上是独立存储的。ROLLUP 表的基本作用,在于在 Base 表的基础上,获得更粗粒度的聚合数据。原创 2024-04-02 15:43:31 · 18561 阅读 · 120 评论 -
深入Doris实时数仓:导入本地数据
Doris 的每一个导入作业,不论是使用 Broker Load 进行批量导入,还是使用 INSERT 语句进行单条导入,都是一个完整的事务操作。导入事务可以保证一批次内的数据原子生效,不会出现部分数据写入的情况。同时,一个导入作业都会有一个 Label。这个 Label 是在一个数据库(Database)下唯一的,用于唯一标识一个导入作业。Label 可以由用户指定,部分导入功能也会由系统自动生成。原创 2024-04-24 18:02:46 · 22224 阅读 · 189 评论 -
深入解析实时数仓Doris:介绍、架构剖析、应用场景与数据划分细节
Doris是一款高性能、开源的实时分析数据仓库,旨在为用户提供毫秒级查询响应、高并发、高可用以及易于扩展的OLAP解决方案。它融合了MPP(大规模并行处理)架构与分布式存储,支持PB级别的数据存储和分析,是大数据场景下理想的实时数仓选择。原创 2024-03-24 10:47:10 · 16927 阅读 · 133 评论
分享