大数据之路、阿里巴巴大数据实践读书笔记 --- 第十章、维度设计

本文深入探讨了维度设计的基础和高级主题,以阿里巴巴大数据实践为例,阐述了维度建模中的拉链表、极限压缩等技术。介绍了维度属性的选择、层次结构、规范化与反规范化、缓慢变化维的处理方式,以及特殊维度如递归层次和行为维度的处理。文章还提到了数据仓库中如何处理多值属性和杂项维度,为大数据仓库优化提供了实用策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

零、写在前面

此章节是我读到现在较难懂的一部分,如果数据仓库水平、处理的数据量、业务种类并不多的情况下,很多情况还是较难理解的,希望大家可以对不懂的地方多读些,欢迎交流讨论;

内含拉链表,以及极限压缩等部分,对于数据仓库模型的优化很有帮助;

 

一、维度设计基础

  • 维度的基本概念

    • 维度是维度建模的基础和灵魂;

    • 在维度建模中,将度量称为“事实”,将环境称为“维度”;

    • 维度所包含的表示维度的列,称为维度属性。维度属性是查询约束条件、分组和报表表亲啊生成的基本来源,是数据易用性的关键。

    • 例如:在查询请求中,获取某类目的商品、正常状态的商品等,是通过约束商品类目属性和商品状态属性来实现的;统计淘宝不同商品类目的每日交易金额,是通过商品维度的类目属性进行分组的;我们在报表中看到的类目、BC类型(B指天猫,C指集市)等,都是维度属性。所以维度的作用一般是查询约束、分类汇总以及排序等;

    • 获取维度或维度属性的方式:

      • 可以在报表中获取;

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

杨鑫newlfe

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值