- 博客(27)
- 收藏
- 关注
转载 5-dw_星型模型和雪花模型
星型模型:由一个事实表连接多个维度表,图形显示像星星一样,在维度表上存在一定的数据冗余,如下图:在上图中,我们的客户维表,对客户存储的省、市、县是有对数据一定的冗余,为了解...
2019-05-26 11:24:06
231
转载 6-dw_元数据管理
元数据是帮助用户和技术人员对数据仓库里的数据理解,可以分为技术元数据和业务元数据。技术元数据包含:1:模型定义定义数据仓库里各各种模型的功能,包括数据的口径...
2019-05-19 19:28:19
142
转载 缓慢变化维程序
create or replace procedure p_abc_dim_dept(p_dt date default sysdate, --to日期 ...
2019-05-14 17:44:46
157
转载 4-dw_退化维
目前是一个数据爆炸时代,数据量增长很快,很多的一些维度表数据量大到足可以影响到你的报表展示,比如一些企业的客户维度表,产品维度表等。我们拿客户维度表来说,在客户维度表中,我们有客户代码,客户名称,月结...
2019-05-12 21:39:49
126
转载 3-dw_缓慢变化维
上次我们理解了维度表,哪什么是缓慢变化维呢,比如我们有这样的一个场景,A客户在4月份的时候归属于X部门,在5月的时候归属于Y部门,如果...
2019-05-09 21:11:28
92
转载 2-dw_事实表、维度表
事实表:记录公司的一笔正常的业务数据,需要提供4W,什么时候(When)在什么地方(Where)有哪些人(Who)做了什么事(What)。为...
2019-05-05 22:12:21
427
转载 1-dw_数据仓库
在公司和企业里一般会有很多的业务系统,比如像销售、财务的、人资等各个部门都有自己为了开展工作或业务需要的系统,正常每个部门的系统都是独立的,如果确实需要别人系统里的数据也是做一个接口来访问,互相之间的数据交互很少,无法从...
2019-05-05 22:10:33
124
转载 14-oracle_数据库开发过程
前面基础知识已经学的差不多了,我们更重要的是如何应用这些基础知识在工作中,把业务的需求通过这些知识点落地,在学习具体案例之前,怎么保证我们的开发过程正确,以下几点是大家在工作中需要经常记住的。1:...
2019-05-04 11:12:37
142
转载 13-oracle_数据库存储过程和包的开发
一:存储过程(图片左边的procedure目录):在数据库的实际开发过程中,我们不可能每个脚本用人工的方式执行,需要...
2019-05-04 11:11:14
163
转载 12-oracle_分区
当表中的数据量不断增大,查询数据的速度就会变慢,这时就应该考虑对表进行分区。表分区后,逻辑上表仍然与原来表一样,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至...
2019-05-04 11:09:38
75
转载 11-oracle_索引
索引大家可以理解为一本书里的目录,方便大家快速定位到自己要的章节,哪么在数据库里也一样,如果一个表数据有1000行数据,如何更快的查询到满足条件的记录,哪么索引就可以派上用场了,索引跟表一样,有自己的存储...
2019-04-14 10:04:26
79
转载 9-oracle_union和union all
Union是对结果集的并集操作,会要求2个集合是要有相同的字段和类型。Union:对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序Union al...
2019-04-14 09:58:16
126
转载 8-oracle_分析函数(二)
1): Lead(),Lag()其实这2个函数的作用非常好理解,Lead()就是取当前顺序的下一条记录,相对Lag()就是取当前顺序的上一行记录。经常会有判断在一定条件下的两条记录之间的时间差、或者数...
2019-03-23 18:02:24
70
转载 7-oracle_分析函数(一)
1.分组聚合函数聚合函数主要有求和:sum();最大数:max();最小数:min();平均值:avg();统计数:count()等,在应用此类函数的时候,要么是从全集合来看或者从分组来看的。分组就是我们之前所说...
2019-03-23 18:01:56
58
转载 6-oracle_表关联
表关联是对2个表的列合并,怎么合并呢,这里需要一个连接信息,也就是关联字段,比如一个学生表里有学号+班级+出生日期,另一个表里有学号+科目+成绩,哪如果需要得到学号+班级+科目+成绩这样的信息,这就需要表关联,关联的字段用什...
2019-03-23 18:01:13
101
转载 5-oracle_创建表
表可以理解是数据库的一种复杂数据类型,用于存放具体数据的逻辑对象。表的形式是一个二维表格,由行和列组成,在统计学里你可以把行理解为样本,列理解为特征,在数据仓库里行就是一个事实,列就是由维度和度量组成。...
2019-03-23 18:00:36
65
转载 4-oracle_基本数据类型
本课我只讲解一些基本常用的数据类型:Char:定长字符串,如果字符没有定义的长度,则后面补空格。Varchar2:可变长字符串。大家需要注意下这2个类型的区别,不然在后续的应用中会有一些坑...
2019-03-23 17:59:54
56
转载 3-oracle_创建用户
oracle内部有两个建好的用户:system和sys。用户可直接登录到sys用户以创建其他用户,因为sys具有创建别的用户的权限,为什么需要创建一个新的用户,主要是sys用户权限太大了,如果某天一不小心,就把生产的重要信息...
2019-03-23 17:59:08
73
转载 0-oracle执行脚本
本课程的所有执行脚本都上传在github上。请参见:https://github.com/blt328/oracle_blt自行下载。 ...
2019-03-23 17:58:05
70
转载 2-plsql开发工具安装
本课主要是安装oracle的开发工具PLSQL Developer 12链接:https://pan.baidu.com/s/1PSVW3LYkAIMjADqVD4G3...
2019-03-09 22:23:00
101
转载 1-oracle环境安装
此课程是oracle开发的第一课,我们先从环境的准备开始。1:oracle的下载和安装 大家登录下面网页下载安装文件...
2019-03-09 22:19:29
56
转载 sh调用sh(串行和并行调度)
#!/bin/bash############################################################# System Name:test# Model Name:调...
2018-05-07 14:48:10
1860
转载 创建sh调用hive程序
#!/bin/bash############################################################# System Name:abc# Model Name:te...
2018-05-07 14:39:14
126
转载 hive程序脚本样本
--#####################################################################--程序说明--filename: test.sql--purpose:...
2018-05-07 14:23:59
207
转载 sqoop同步hdfs到关系库
sudo -u fin-abc sqoop export --connect "jdbc:oracle:thin:@192.168.0.10:1521:finabc" --username "ETL" --password "e...
2018-05-07 14:08:38
142
转载 hive创建外部分区表
drop table if exists itp_bsl_tab;create external table itp_bsl_tab(version_no string c...
2018-05-07 14:03:13
165
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人