hive
小小可凡
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据仓库三层架构设计
简介 作为一名数据的规划者,我们肯定希望自己的数据能够有秩序地流转,数据的整个生命周期能够清晰明确被设计者和使用者感知到。直观来讲就是如下的左图这般层次清晰、依赖关系直观。 但是,大多数情况下,我们完成的数据体系却是依赖复杂、层级混乱的。如下的右图,在不知不觉的情况下,我们可能会做出一套表依赖结构混乱,甚至出现循环依赖的数据体系。 因此,我们需要一套行之有效的数据组织和管理方法来让我们的数据体系更有序,这就是谈到的数据分层。数据分层并不能解决所有的数据问题,但是,数据分层却可以给我们带来如下的好处: 清晰原创 2020-12-15 11:30:22 · 8143 阅读 · 1 评论 -
hive开窗函数
普通的聚合函数聚合的行集是组,开窗函数聚合的行集是窗口。因此,普通的聚合函数每组(Group by)只返回一个值,而开窗函数则可为窗口中的每行都返回一个值。简单理解,就是对查询的结果多出一列,这一列可以是聚合值,也可以是排序值。 开窗函数一般分为两类,聚合开窗函数和排序开窗函数。 点击查看详细内容 hive开窗函数 ...翻译 2020-10-22 10:19:36 · 156 阅读 · 0 评论 -
hive
hive 1.简介 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为 一张数据库表,并提供类 SQL 查询功能 本质是将 SQL 转换为 MapReduce 程序。 Hive的好处 直接使用 Hadoop MapReduce 处理数据所面临的问题: 人员学习成本太高 MapReduce 实现复杂查询逻辑开发难度太大 使用 Hive : 操作接口采用类 SQL 语法,...原创 2019-02-15 14:46:25 · 395 阅读 · 0 评论 -
hive 常用运算
hive 常用运算 第一部分:关系运算 Hive支持的关系运算符 •常见的关系运算符 •等值比较: = •不等值比较: <> •小于比较: < •小于等于比较: <= •大于比较: > •大于等于比较: >= •空值判断: IS NULL •非空判断: IS NOT NULL •LIKE比较: LIKE •JAVA的LIKE操作:原创 2019-02-15 15:13:48 · 3760 阅读 · 0 评论 -
hive的安装
1.上传tar包 2.解压 tar -zxvf hive-1.2.1.tar.gz 3.安装mysql数据库 推荐yum 在线安装 4.配置hive (a)配置HIVE_HOME环境变量 vi conf/hive-env.sh 配置其中的$hadoop_home (b)配置元数据库信息 vi hive-site.xml 添加如下内容: <configuration> &...原创 2019-02-15 15:19:49 · 133 阅读 · 0 评论
分享