
hive
SkyingData
心如止水 波澜不惊
越秃越强
展开
-
Hive系列之Hive架构设计原理
文章目录一.Hive基本使用二. Hive架构设计三. Hive运行流程详解 一.Hive基本使用 切换到可以操作hive的用户 直接输入hive回车,进入hive cli 常用命令使用 查看所有数据库:show databases; 创建数据库tianliangedu,即为create database tianliangedu 选择数据库 设置显示当前所在数...原创 2020-02-12 21:05:21 · 235 阅读 · 0 评论 -
Hibv 系列之Hive概述
一Hive概述 专业定义 英文名称为Data Warehouse,可简写为DW。 是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。 它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。 通俗解释 面向分析的存储系统(面向数据分析的存储系统) 一个面向主题的(Subject Or...原创 2020-02-12 20:52:13 · 514 阅读 · 0 评论 -
数据开发类-数据仓库开发类项目主要流程(中小型)
1.需求描述 具体要做什么东西 1.输入 2.处理 3.输出 2.需求分析 .是否具备可行性 .输入 .处理 .输出 3.开发步骤分析 1.搭数据仓库类项目的开发骨架 Create : 把创建相关代码Shell放入其中 Config : 把相关配置参数放入其中 UDF : 放入相关的依赖的第三方jar包 Deal : 主要存放当前项目的处理数据的shell脚本(全部脚本) 2...原创 2020-02-12 10:33:34 · 486 阅读 · 0 评论 -
Hive中 order by 和 sort by 的 区别
1. Order by 排列出来的数据是 全局有序 但只有一个 分区 2. Sort by 排列出来的数据是 局部有序 同一个 分区内 不同分区之间没有关系原创 2020-02-10 10:19:16 · 1503 阅读 · 0 评论