Hive
weizhouck
学无止境,乐此不疲
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
HIive_原理与安装(一)
HIVE 基本概念 Hive 简介 什么是Hive hive 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 为什么用Hive 难点:学习成本太高;项目周期要求太短;MapReduce实现复杂逻辑开发难度大; 优势:接口采用类SQL语法,提供快速开发能力;不需要写MapReduce,减少学习成本;功能扩...原创 2018-08-24 16:38:47 · 1213 阅读 · 0 评论 -
Hive_函数(四)
1:内置函数 hive 内置函数有很多,如同mysql自带的一系列函数:如 nvl(),sum(),avg()等等 2:Hive 自定义函数 UDF开发 UDF 作用于单个数据行,产生一个数据行作为输出。(数学函数,字符串函数) UDAF(用户定义聚集函数):接收多个输入数据行,并产生一个输出数据行。(count,max) 开发实例 1、先开发一个java类,继承UDF,并重载...原创 2018-09-25 15:09:29 · 259 阅读 · 0 评论 -
Hive_基本操作(二)
DDL 操作 建表语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col...原创 2018-09-20 16:18:23 · 421 阅读 · 0 评论 -
Hive_桶表(三)
桶表的介绍 对于每一个表(table)或者分区,Hive 可以进一步组织成桶,也就是说,桶时更为细粒度的数据范围划分。Hive 也是针对某一列进行桶的组织。Hive 采用对列值哈希,然后除以桶的个数求余的方式决定记录存放在哪个桶当中。 把表或者分区组织成桶有两个理由: (1)或者更高的查询处理效率。桶表为表加上了额外的结构,Hive在处理有些查询时能利用这个结构。具体而言,连接两个在(包含连...原创 2018-09-21 15:49:14 · 381 阅读 · 0 评论
分享