
数据仓库
文章平均质量分 94
不名一文
飞翔的菜鸟,keep moving
展开
-
数据仓库简介
一图解千愁 1.概念 1.1.数据仓库概念 数据仓库之父比尔·恩门(Bill Inmon)给出数据仓库的定义如下: 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support) 面向主题:面向抽象或者面向业务。比如仓储,速运、财务等业务域 集成:数据仓库相当于一个数.原创 2018-07-09 23:59:18 · 1368 阅读 · 1 评论 -
hive简介
1.HIVE基本概念 1.1 什么是 Hive Hive:由 Facebook 开源用于解决海量结构化日志的数据统计 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并 提供类 SQL 查询功能 本质是:将 HQL 转化成 MapReduce 程序 Hive 处理的数据存储在 HDFS Hive 分析数据底层的实现是 MapReduce/Spark 执行程序运行在 Yarn 上 1.2 Hive 的优缺点 1.2.1 优点 1) 操作接口采用类 SQ.原创 2020-11-30 18:41:12 · 582 阅读 · 0 评论