
hadoop生态圈
The Great Bear
这个作者很懒,什么都没留下…
展开
-
数仓学习之路二
数据仓库的分层 数据仓库的特征在于面向主题、集成性、稳定性和时变性,用于支持管理决策。数据仓库的存在的意义在于对企业 的所有数据进行汇总,为企业各个部门提供统一的、规范的数据出口。数据仓库在构建过程中通常都需要进行分层 处理。业务不同,分层的技术处理手段也不同。数仓分层的主要原因: 1通过数据预处理提高效率,因为预处理,所以会存在冗余数据 2如果不分层而业务系统的业务规则发生变化,就会影响整个数据...原创 2019-12-17 15:31:11 · 1265 阅读 · 0 评论 -
数仓学习之路一
一、数据仓库的起源 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库之父比尔∙恩门(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立数据仓库》)一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定...原创 2019-12-17 09:18:19 · 1524 阅读 · 0 评论 -
hive
hive 年龄 星座原创 2019-12-16 09:06:38 · 161 阅读 · 0 评论 -
大数据之Oozie学习之路一
一、Oozie简介 Oozie英文翻译为:驯象人。一个基于工作流引擎的开源框架,由Cloudera公司贡献给Apache,提供对Hadoop Mapreduce、Pig Jobs的任务调度与协调。Oozie需要部署到Java Servlet容器中运行。主要用于定时调度任务,多任务可以按照执行的逻辑顺序调度。 二、Oozie的功能模块介绍 2.1 模块 (1) Workflow 顺序执行流程节点,支...原创 2019-12-06 02:09:26 · 307 阅读 · 0 评论