
hive入门
文章平均质量分 84
NobiGo
这个作者很懒,什么都没留下…
展开
-
Hive数据存储的各种模式
Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据;而元数据是用来存储表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。下面分别来介绍。一、Hive的数据存储Hive是基于Hadoop分布式文件系统的,它的数据存储在Hadoop分布式文件系统中。Hive本身是没有专门的数据存储格式,也没有为数据建立索引,只需要在创建表的时候告诉Hive数据转载 2016-09-22 17:52:04 · 580 阅读 · 0 评论 -
hive分区(partition)简介
1. 为什么要分区? 1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。 2、分区表指的是在创建表时指定的partition的分区空间。 3、如果需要创建有分区的表,需要在create表的时候调用可选参数partitioned by。 2. 实现细节 1、一个表可以拥有一个或者多个分区,原创 2016-09-23 01:10:01 · 1046 阅读 · 0 评论 -
Hadoop Hive基础SQL语法(DDL 操作)
介绍: Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需 要的内容,这套SQL 简称Hive SQL,使不熟悉mapreduce 的用户很方便原创 2016-09-23 15:31:08 · 608 阅读 · 0 评论 -
Hive HWI 安装及配置
在Hive已经安装成功的基础上,进行安装Hive HWI Hive Web Interface(HWI)简介:Hive自带了一个Web-GUI,功能不多,可用于效果展示。 由于hive-bin包中没有包含HWI的页面,只有Java代码编译好的jar包:hive-hwi-1.2.0.jar 因此需要下载源码从中提取jsp文件并打包成war文件到hive-lib目录中:wget http://mi原创 2016-10-11 11:16:22 · 3443 阅读 · 0 评论 -
Hadoop Hive基础SQL语法(DML 操作:元数据存储)
2. DML操作:元数据存储hive不支持用insert语句一条一条的进行插入操作,也不支持update操作。数据是以load的方式加载到建立好的表中。数据一旦导入就不可以修改。DML包括:INSERT插入、UPDATE更新、DELETE删除 •向数据表内加载文件 •将查询结果插入到Hive表中 •0.8新特性 insert into2.1.0 向数据表内加载文件 LOAD DA原创 2016-09-25 19:12:30 · 534 阅读 · 0 评论 -
Hadoop Hive基础SQL语法(DQL 操作:数据查询SQL)
3.1 基本的Select 操作 SELECT [ALL | DISTINCT] 字段名, 字段名, … FROM 表名 [WHERE 条件] [GROUP BY 列名 [HAVING 条件]] [ CLUSTER BY 列名 | [DISTRIBUTE BY 列名] [SORT BY | ORDER BY 列名]][LIMIT 数字] •使用ALL和DISTINCT选原创 2016-09-27 17:49:30 · 575 阅读 · 0 评论 -
Hive常见问题汇总
1 执行#hive命令进入Hive CLI时报如下错误:Exception in thread "main" java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient原创 2016-11-21 10:25:16 · 730 阅读 · 0 评论