
Hive技术总结
文章平均质量分 70
项目中经常用到的Hive技术知识。
郝少
爱出者爱返,福往者福来。
展开
-
【Hive】内置函数—关系运算
hive关系运算内置函数大全原创 2022-10-23 14:10:24 · 241 阅读 · 0 评论 -
【Hive】内置函数—日期函数
【Hive】内置日期函数大全原创 2022-10-22 10:52:44 · 665 阅读 · 0 评论 -
【Hive】内置函数—字符串函数
hive字符串内置函数大全原创 2022-10-21 18:03:08 · 4160 阅读 · 0 评论 -
【Hive】内置函数—条件函数
hive条件函数使用总结原创 2022-10-21 10:17:55 · 1002 阅读 · 0 评论 -
【Hive|Spark】spark写入hive表存储格式问题
The format of the existing table default.student is `HiveFileFormat`. It doesn't match the specified format `OrcFileFormat`.;原创 2022-10-14 17:46:17 · 3051 阅读 · 0 评论 -
【Hive】建表时的存储格式
hive建表时的存储格式原创 2022-09-09 10:15:24 · 6219 阅读 · 3 评论 -
【Hive】insert into 与 insert overwrite的区别
insert into 和 insert overwrite区别原创 2022-09-06 14:54:56 · 3240 阅读 · 0 评论 -
【Hive】各种join连接用法
hive join连接的各种用法原创 2022-09-02 11:46:58 · 7255 阅读 · 1 评论 -
Hive脚本及动态传参
一、Hive参数[root]# hive -help -d,--define <key=value> Variable subsitution to apply to hive commands. e.g. -d A=B or --define A=B --database <databasename> Specify the database to use -e <原创 2021-08-31 16:17:26 · 1570 阅读 · 0 评论 -
Hive自定义函数UDF(二)
1、需求自定义将字符串转大写和小写的Hive UDF;2、maven依赖及代码 <dependencies> <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</artifactId> <version>1.2.1</vers原创 2021-08-31 14:18:50 · 300 阅读 · 0 评论 -
Hive_定位hive表的各种信息
目录一、目的二、操作1、建表2、desc formatted 表名3、desc 表名4、show create table 表名一、目的主要为了阐述在现场的开发环境中怎么定位查看hive表的一些信息:是否为内部表、外部表 存储位置 字段分隔符 分区字段 建表语句二、操作1、建表 --创建内部表create table inner_stu(id string,name string) row format delimited fields termin原创 2021-07-30 10:29:39 · 973 阅读 · 0 评论 -
Hive分桶
一、概念1、定义对Hive(Inceptor)表分桶可以将表中记录按分桶键的哈希值分散进多个文件中,这些小文件称为桶。2、为什么进行分桶(1)获得更高的查询处理效率。比如JOIN操作。对于JOIN操作两个表有一个相同的列,如果对这两个表都进行了桶操作。那么将保存相同列值的桶进行JOIN操作就可以,可以大大较少JOIN的数据量。(2)使取样(sampling)更高效。在处理大规模数...原创 2020-03-20 11:30:29 · 568 阅读 · 0 评论 -
Hive表分区的增删改查
1、查询分区hive> show partitions stu;OKschool=AA/classroom=001school=AA/classroom=005school=BB/classroom=001Time taken: 0.047 seconds, Fetched: 3 row(s)2、增加表分区hive> alter table stu add p...原创 2020-03-19 15:03:05 · 333 阅读 · 0 评论 -
Hive分区
Hive分区应用实战原创 2020-03-19 14:47:51 · 7951 阅读 · 4 评论 -
Hive创建新表的集中方式
一、语法创建1、创建teacher表hive> create table teacher(id string,name string) row format delimited fields terminated by ',' COLLECTION ITEMS TERMINATED BY ',' MAP KEYS TERMINATED BY ':' LINES TERMINATED...原创 2020-03-19 11:51:29 · 240 阅读 · 0 评论 -
Hive元数据存储和表数据存储
一、相关概念1、元数据(metadata)元数据(Meta Date),主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及 ETL 的任务运行状态。一般会通过元数据资料库(Metadata Repository)来统一地存储和管理元数据,其主要目的是使数据仓库的设计、部署、操作和管理能达成协同和一致。元数据包括表的属性、表的名称、表的列、分区及其属性以及表数据所...转载 2020-03-19 09:53:25 · 13049 阅读 · 0 评论 -
Hive内部表和外部表理解测试
一、概念内部表数据由Hive自身管理,外部表数据由HDFS管理;内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse);外部表数据的存储位置由自己制定(如果没有LOCATION,Hive将在HDFS上的/user/hive/warehouse文件夹下以外部表的表名创建一个文件夹,并将属于这个表的数据存放在这里);...原创 2020-03-19 09:16:13 · 671 阅读 · 0 评论 -
Hive命令行窗口drop删除报错
1、错误描述hive> drop table src;FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:You have an error in your SQL syntax; check the manual that ...原创 2020-03-18 17:37:34 · 493 阅读 · 0 评论 -
hive执行count(*):Stage-1 map = 0%, reduce = 0%
1、问题描述:在hive的shell端执行:select count(*) from student;出现了下面问题(一直卡着):hive> select count(*) from student;WARNING: Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions...原创 2019-07-13 15:33:40 · 6670 阅读 · 3 评论 -
HiveJdbc(javaApi)及遇到的坑
一、环境:hive: 2.1.1mysql: 5.6.35hadoop: 2.7.3mysql连接器:mysql-connector-java-5.1.25-bin.jar二、准备工作1、[root@cmaster bin]# ./hive2、[root@cmaster bin]# ./hiveserver2三、javaApipackage com.hive....原创 2019-07-16 14:56:19 · 690 阅读 · 0 评论 -
Hive自定义函数UDF(一)
在使用hive的时候,hive本身自带的函数不足以满足于我们需求的情况下,我们可以自定义满足我们需求的函数。一、hive自定义函数步骤:1、继承org.apache.hadoop.hive.ql.exec.UDF;2、写固定的evaluate()方法。这个方法名字是固定的。注意:evaluate方法支持重载。二、实例演示1、代码package com.hive.tes...原创 2019-07-16 16:05:44 · 325 阅读 · 0 评论 -
Hive导入数据的四种方式
Hive导入数据的四种方式2、HDFS上导入数据到Hive表先将文件从本地导入到hdfs上注意:(1)是移动不是复制,hdfs中的teacher2.txt移动走了。(2)如果有多个文件可以:load data inpath '/input/*' into table teacher;3、从别的表中查询出相应的数据并导入到Hi...原创 2019-07-22 13:10:24 · 15507 阅读 · 0 评论 -
Hive数据导出三种方式
1、导出到本地文件系统2、导出到HDFS中注意,和导出文件到本地文件系统的HQL少一个local,数据的存放路径就不一样了。如果没有提前在hdfs中创建hdfs文件夹,会自动创建。3、导出到Hive的另一张表中......原创 2019-07-22 13:24:21 · 4006 阅读 · 1 评论 -
Linux下hive安装及测试
前提:提前在linux下安装好了hadoop和mysql并且已经启动。apache-hive-2.1.1-bin.tar.gz,提取码:2lormysql-connector-java-5.1.7-bin.jar,提取码:5k6c 1、将下载好的apache-hive-2.1.1-bin.tar.gz导入自己新建的hive目录下。2、解压:tar -xzvf apache-hi...原创 2019-07-13 10:20:28 · 1814 阅读 · 1 评论