
Hive
文章平均质量分 66
A_ChunUnique
大数据爱好者
展开
-
Hive简单部署
一、下载hive1、/opt/software/目录下 weget http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz2、解压到/opt/app/路径下[root@hadoop001 software]# tar -zxvf hive-1.1.0-cdh5.7.0.tar.gz -C /opt/app/3、hive-1原创 2017-09-24 02:19:26 · 490 阅读 · 0 评论 -
通过MySQL中元数据信息删除Hive中的表
一、确定Hive中需删除的表名(order_mulit_partition 分区表)hive (default)> desc formatted order_mulit_partition;OKcol_name data_type comment# col_name data_type comment原创 2017-11-01 17:00:36 · 2368 阅读 · 0 评论 -
Hive元数据在MySQL的存储逻辑及关系
Hive元数据在MySQL中的存储逻辑及关系转载 2017-11-01 10:51:51 · 2183 阅读 · 0 评论 -
Hive内部表与外部表(外部表使用场景)
Managed and External TablesBy default Hive creates managed tables, where files, metadata and statistics are managed by internal Hive processes. A managed table is stored under the hive.metastore.wareh原创 2017-10-07 17:07:22 · 7437 阅读 · 0 评论 -
IDEA构建UDF函数&注册到Hive源码&编译&验证及使用
一、注册到Hive源码目的 在上一篇UDF函数博文中说过,Hive自带的函数并不能满足日常工作,有很多功能需要我们自己去编写。对于经常使用的功能就希望注册到Hive当中和Hive的函数一样使用了。二、IDEA构建UDF函数请参考IDEA构建Hive的UDF函数三、注册到Hive源码 1、下载Hive源码2、将Hive源码放到/opt/sourcecode目录下并解压[root@hadoop001原创 2017-10-09 16:13:42 · 1960 阅读 · 0 评论 -
Hive Common Join VS Map Join
以下是个人理解,如有偏差,望大家多多指点!一、Common Join(也称之为shufflejoiin/reducejoin) 1、Common Join图解 a>首先会启动一个Task,Mapper会去读表HDFS上两张X/Y表中的数据 b>Mapper处理过数据再经过shuffle处理 c>最后由reduce输出join结果2、举例 Table A ID NAME原创 2017-09-21 19:06:25 · 638 阅读 · 0 评论 -
Hive静态分区和动态分区
一、静态分区 1、创建分区表hive (default)> create table order_mulit_partition( > order_number string, > event_time string > ) > PARTITIONED BY(event_month st原创 2017-10-08 13:34:32 · 3435 阅读 · 1 评论 -
Hive创建分区表
一、创建分区表hive (default)> create table order_partition( > order_number string, > event_time string > PARTITIONED BY(event_month string) > row format d原创 2017-10-07 23:31:24 · 7224 阅读 · 0 评论 -
Java API操作Hive
官网地址 https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-JDBC一、启动hiveserver2 使用Java API操作hive之前必须启动hiveserver2(服务都没起,客户端怎么可能访问的到呢?)启动命令[root@hadoop001 bin]# hivese原创 2017-10-07 18:57:19 · 1207 阅读 · 0 评论 -
IDEA构建Hive的UDF函数
一、编译目的 hive自带了很多内置函数,但是这些函数并不能满足我们的日常工作。当我们频繁需要使用一个函数而hive又没有时就需要我们自定义函数了。二、UDF(user defined function)函数构建步骤 1、自定义一个Java类 2、继承UDF类 3、重写evaluate方法 4、打成jar包 6、在hive执行add jar方法 7、在hive执行创建模板函原创 2017-10-07 13:59:57 · 6373 阅读 · 0 评论 -
Hive四种数据导入方式
Hive常见数据导入方式: 1、从本地导入数据到hive表 2、从hdfs导入数据到hive表 3、从其他表导入数据到hive表 4、创建表时从其他表导入数据到hive表一、首先看前两种方式 官方导入语法格式LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=va原创 2017-09-17 19:14:14 · 2704 阅读 · 0 评论 -
Hive表的操作
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-CreateTableCreate/Drop/TruncateTable从官网得知表的操作语法如下CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]t原创 2017-09-17 11:55:03 · 487 阅读 · 0 评论 -
Hive数据库操作
Hive部署完成后我们就要来使用了一、数据库创建CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT database_comment] [LOCATION hdfs_path] [WITH DBPROPERTIES (property_name=property_value, ...)];我们可以按照官网给出的原创 2017-09-17 00:44:59 · 521 阅读 · 1 评论 -
Hive2.1.1环境部署
一、Hive包的下载 到http://mirror.bit.edu.cn/apache/hive/hive-2.1.1/网址下载 apache-hive-2.1.1-bin.tar.gz二、部署需求Installation and ConfigurationYou can install a stable release of Hive by downloading a tarball, or原创 2017-09-16 23:46:07 · 498 阅读 · 0 评论 -
Hive配置显示当前数据库及表字段
hive-site.xml添加以下参数:<property> <name>hive.cli.print.current.db</name> <value>true</value></property><property> <name>hive.cl原创 2018-06-08 21:57:41 · 1930 阅读 · 0 评论