维度建模培训随笔

数据仓库是从大的数据中获取一些宏观指标,为决策提供支持
报表,一个报表的作用是确定后期的工作, 明白事,分析事,
数据仓库是对系统建设的一种推动,可以发现原系统问题,规范各系统之间的数据定义及内容。
举例:
维度冗余,体系要一致,
原始底层维度就冗余,而很多地方新生成的数据是根据维度表间关系连接而得到,这样,可能造成
数据入口不同而数据不一致, 分析具体原因,数据仓库项目中,尽量确定统一入口进行统计。
数据仓库内部一致性,发现问题,分析问题,
数据编码尽量用户不可见。
从自身角度、个人所经历项目或目前所做的事情,认真分析概念内容。
认真分析系统中所涉及的维度表,确定其的组织形式、是否需要缓慢变化、层次、数据来源等内容。掌控数据。
重要:--事实表,表示维度多对多的关系。如果是多对一,则可以维度抽取出于另一维度中
忌讳:
套概念,
尽量不做更新操作,因为要考虑回退操作,很难实现
尽量采用流水的加减实现数据的统计
举例:
1,维度指标设计,如 一些标准值
建模尽量抛开业务,如 游戏种类和游戏,单一主键

维度过多,合种相关的维度进行抽像提出,事实表中只包含最细粒度维度,
注意:如两者之间虽然有联系,但随时会发生变化,可考虑事实表冗余此维度。  77页
代理关键字考虑  ,避免字段带有技巧性内容,,,为什么, 因为今天业务如此是技巧,明天就是垃圾
把一些非累加半累加转换成全累加型模型,(重要)
把一些多事务事实表,转化为单事务事实表。
周期快照,考验,每天一个余量 ,,比如,三月份公司员工有多少人,应该是一个时间点的人数,银行存款,,==
举例:录像,每帧为一个周期快照
业务环节的记录,事务快照,多数为更新,,
-----最后,数据仓库总线介绍,,矩阵法
             维度的一致性,,维度成员都是单独的,不存在相交情况
缓慢变化,对应几种情况
快速变化,采用维度追加于事实表中
数据难处理的是活跃的数据,分析活跃数据的生命周期,制定相应数据存储
--------------开篇:
先说一些常见的数据统计,单时间,跨时间(多业务环节)
事实表拆分考虑,统计维度是互折的,业务中不可能同时查询此两维度,
为每个业务主题保留最细粒度的维度模型
---------------
避免维度表中的主键有内在的含义         
操作型系统中的产品键都是有内在含义的
不要用生产系统中的键作为维度表的主键                     --不同意思,需要特定的转换,麻烦
反映历史时,同一键可能对应不同的实体
 
-----------------------------------------------------
个人一些建议:
对于底层事实表尽量使用事务事实表(少用更新操作)
避免字段技巧性设计
围绕业务流程构建维度模型
对于事实表中度量尽量考虑可全累加设计
事实表中代理主键的慎用
保证数据入口的一致性
事实表中尽量有且仅有单一的时间维
缓慢变化维及事实表冗余的设计权衡
事实规范化(把事实表中保留单个度量)慎用
维度建模理论体系较大,择其合适使用之
 

数据仓库采用使用维度建模的好处:易理解、查询的高性能、修改的灵活性和可扩充性。

维度建模是一个可不断扩充添加的过程

1)、在现有的事实表中增加维度。

2)、在事实表中增加事实。

3)、在维度表中增加属性。

在比较了解业务情况下,可先以底层细粒度构建开始,反之,以业务需求的粗粒度开始,至顶向下

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/134308/viewspace-761167/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/134308/viewspace-761167/

先展示下效果 https://pan.quark.cn/s/5061241daffd 在使用Apache HttpClient库发起HTTP请求的过程中,有可能遇到`HttpClient`返回`response`为`null`的现象,这通常暗示着请求未能成功执行或部分资源未能得到妥善处理。 在本文中,我们将详细研究该问题的成因以及应对策略。 我们需要掌握`HttpClient`的运作机制。 `HttpClient`是一个功能强大的Java库,用于发送HTTP请求并接收响应。 它提供了丰富的API,能够处理多种HTTP方法(例如GET、POST等),支持重试机制、连接池管理以及自定义请求头等特性。 然而,一旦`response`对象为`null`,可能涉及以下几种情形:1. **连接故障**:网络连接未成功建立或在请求期间中断。 需要检查网络配置,确保服务器地址准确且可访问。 2. **超时配置**:若请求超时,`HttpClient`可能不会返回`response`。 应检查连接和读取超时设置,并根据实际需求进行适当调整。 3. **服务器故障**:服务器可能返回了错误状态码(如500内部服务器错误),`HttpClient`无法解析该响应。 建议查看服务器日志以获取更多详细信息。 4. **资源管理**:在某些情况下,如果请求的响应实体未被正确关闭,可能导致连接被提前释放,进而使后续的`response`对象为`null`。 在使用`HttpClient 3.x`版本时,必须手动调用`HttpMethod.releaseConnection()`来释放连接。 而在`HttpClient 4.x`及以上版本中,推荐采用`EntityUtils.consumeQuietly(respons...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值