
Hive
自己复习 整理
不会敲代码的小力
OvO
自己做的一些笔记便于自己回顾
展开
-
hive的数据类型
hive的数据类型1.Hive的内置数据类型可以分为两大类:(1)、基础数据类型;(2)、复杂数据类型2.hive基本数据类型3.hive集合类型3.1 集合类型之array(1) 先创建一张表(2)准备数据文件 array.txt(3)加载数据文件到t_array表中(4)查询数据3.2 集合类型之map(1) 先创建一张表(5)准备数据文件 map.txt(6)加载数据文件到t_map表中(1) 先创建一张表(8)准备数据文件 struct.txt(9)加载数据文件到t_struct表中(10)查询数据原创 2020-12-05 17:27:23 · 497 阅读 · 0 评论 -
启动hiveserver2服务
启动hiveserver2服务启动hiveserver2服务后台启动beeline连接hiveserver2启动hiveserver2服务后台启动cd /export/servers/hive-1.1.0-cdh5.14.0nohup bin/hive --service hiveserver2 &beeline连接hiveserver2bin/beelinebeeline> !connect jdbc:hive2://Hadoop003:10000...原创 2020-09-12 09:55:37 · 821 阅读 · 0 评论 -
Hive的优化方案
Hive的优化1、 Fetch抓取2、本地模式3、数据倾斜4、Count(distinct)5、分区剪裁、列剪裁6、动态分区调整7、数据倾斜8、影响Map的数量9、影响reduce的数量10、并行执行11、严格模式12、jvm重用13、 推测执行1、 Fetch抓取设置属性 set hive.fetch.task.conversion=none;所有的查询语句都要转化成MR程序。**set hive.fetch.task.conversion=more; **简单的查询不会转化成MR程序(sele原创 2020-08-14 21:05:36 · 2795 阅读 · 0 评论 -
Hive表数据加载和导出
Hive表数据加载和导出Hive表数据加载Hive数据的导出清空hive数据表Hive查询语句Hive修改配置文件优先级Hive支持的数据存储格式Hive表数据加载五种情况1、直接向分区表中插入数据insert into table score3 partition(month =‘201807’) values (‘001’,‘002’,‘100’);2、通过查询插入数据(linux ) load data local inpath ‘/export/servers/hivedatas/sc原创 2020-08-14 20:21:11 · 2602 阅读 · 0 评论 -
Hive基本介绍(4)
Hive基本介绍3Hive的自定义函数UDFHive通过reflect调用java方法Hive的自定义函数函数查看show functions;show function 函数名 ;desc function extended upper;UDF UDAF UDTF一进一出 多进一出 一进多出UDF1.创建一个class 继承UDF2. 编写evaluate函数,在这里编写业务需求需要的代码3. 打成jar包,并上传4. 将jar包添加到hive 在hi原创 2020-08-14 20:09:35 · 2526 阅读 · 0 评论 -
Hive基本介绍(3)
Hive基本介绍3Hive的数据类型基本数据类型复杂数据类型加载数据外部表内部表分区表特别强调:作用:分桶表特别强调:分桶逻辑:分桶的作用和好处Hive的数据类型基本数据类型INT BIGINT FLOAT DOUBLE DEICIMAL STRING VARCHAR CHAR BINARY TIMESTAMP DATE INTERVAL ARRAY复杂数据类型MAP STRUCT UNIONcreate table stu3 as select * from stu2; 复制数据复试表结构c原创 2020-08-12 15:37:21 · 2415 阅读 · 0 评论 -
Hive基本介绍(2)
Hive基本介绍2数据格式:数据格式部分自定义:hive支持的数据格式Hive元数据Hive的访问方式Hive传选项数据库的基本操作数据表的基本操作(增删改查)创建基本数据表(内部表):创建外部数据表:内部表与外部表的区别:删除表修改表查询表数据格式:Hive中没有定义专门的数据格式数据格式部分自定义:列分隔符(通常为空格、”\t”、”\x001″)行分隔符(”\n”)读取文件数据的方法(Hive 中默认有三个文件格式 TextFile,SequenceFile 以及 RCFile)。Hiv原创 2020-08-12 15:07:39 · 2487 阅读 · 0 评论 -
Hive基本介绍(1)
Hive基本介绍1Hive基本概念Hive的意义是什么Hive可以对数据进行存储与计算Hive缺点Hive的内部组成架构Hive基本概念是一个基于hadoop的数据仓库工具,可以将结构化数据映射成一张数据表,并提供类SQL的查询功能。Hive的意义是什么背景:hadoop是个好东西,但是学习难度大,成本高,坡度陡。意义(目的):降低程序员使用hadoop的难度。降低学习成本。Hive可以对数据进行存储与计算存储使用HDFS存储计算使用MapReduce进行计算Hive的特性1、扩展原创 2020-08-12 14:47:01 · 2649 阅读 · 0 评论 -
HIVE的安装及部署
我们在此处选择第三台机器作为我们hive的安装机器1.1、derby版hive直接使用:(不推荐)1、解压hivecd /export/softwares//解压安装包到指定位置tar -zxvf hive-1.1.0-cdh5.14.0.tar.gz -C ../servers/2、直接启动 bin/hivecd ../servers/cd hive-1.1.0-cdh5.1...翻译 2019-11-19 15:58:26 · 3400 阅读 · 1 评论 -
Hive介绍
什么是HiveHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,hive可以理解为一个将SQL转换为MapReduce的任务的工具为什么使用Hive直接使用hadoop所面临的问题人员学习成本太高项目周期要求太短MapRedu...翻译 2019-11-19 15:00:58 · 2676 阅读 · 0 评论