
数据仓库
文章平均质量分 76
逆水行舟如何
热爱开源,喜欢去研究各种源码
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
开源实时数仓的构建
StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、CBO、智能物化视图、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。既支持从各类实时和离线的数据源高效导入数据,也支持直接分析数据湖上各种格式的数据。兼容 MySQL 协议,可使用 MySQL 客户端和常用 BI 工具对接。同时 StarRocks 具备水平扩展,高可用、高可靠、易运维等特性。广泛应用于实时数仓、OLAP 报表、数据湖分析等场景。原创 2024-10-24 14:07:06 · 1209 阅读 · 0 评论 -
数据仓库建设之元数据管理
1 元数据介绍1、元数据是什么? 描述数据的数据如果我们要描述清楚一个实际的数据,以某张表为例,我们需要知道表名、表别名、表的所有者、数据存储的物理位置、主键、索引、表中有哪些字段、这张表与其他表之间的关系等等。所有的这些信息加起来,就是这张表的元数据。2、元数据管理,是数据治理的核心和基础元数据就相当于是所有数据的一张地图。在这张关于数据的地图中,我们可以知道:我们有哪些数据?数据分布在哪里?这些数据分别是什么类型?数据之间有什么关系?哪些数据经常被引用?哪些数据无人原创 2021-07-19 16:20:07 · 961 阅读 · 0 评论 -
数据仓库建设之数据模型
数据模型 数据模型是对现实事物的反映和抽象,能帮助我们更好地了解客观世界。数据模型定义了数据之间的关系和结构,使得我们可以有规律地获取想要的数据。例如,在一个超市里,商品的布局都有特定的规范,商品摆放的位置是按照消费者的购买习惯以及人流走向进行摆放的1、数据模型的作用 数据模型是业务需求分析之后,数据仓库工作开始的第一步。良好的数据模型可以帮助我们更好地存储数据,更有效地获取数据,保证数据间的一致性。2、模型设计的基本原则高内聚和低耦合 一个逻辑和物理模型由哪些记录和字段组成,应该遵循原创 2021-07-19 16:06:41 · 555 阅读 · 0 评论