
HIVE
文章平均质量分 83
阳哥赚钱很牛
努力努力努力
展开
-
Hive的连接查询——Join查询
Join语句主要做多表关联查询:当我们需要的数据来自多张表,多张表之间还有连接关系,我们就可以使用连接查询获取我们相关的信息。 Hive中连接查询和sql中的join连接几乎一致,共有四种:内连接、左外连接、右外连接、满外连接。注意在MySQL中支持四种连接的语法,但是不支持满外连接的操作(满外连接的语法是支持的)。Hive都支持。join语句的一般格式:select 查询字段from tableA[inner|left|right...原创 2021-08-31 16:29:51 · 3140 阅读 · 0 评论 -
Hive中的自定义hive函数
我们一般只自定义UDF和UDTF函数。原创 2021-08-28 21:38:51 · 637 阅读 · 3 评论 -
数据仓库Hive中的内置函数
函数是hive封装好的一些功能性代码,可以帮助我们快速完成相应的业务逻辑。一、Hive的自带函数1、我们可以先使用命令来查看系统自带的函数:hive>show functions;2、显示自带函数的用法:hive>desc function 函数名;例如:desc function sum;如果我们想了解详细的函数用法,就可以使用如下命令:hive> desc function extended sum;二、Hive函数的分类...原创 2021-08-26 21:44:40 · 853 阅读 · 4 评论 -
数据仓库Hive的分区表与分桶表
一、分区表分区表实际上就是对应一个HDFS文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多。所谓的分区表其实和表中的字段没什么区别,包括其使用,唯一的区别就是在于向hdfs写表数据的时候,会以分区值先在表的hdfs目录下创建一个分区目录,再添加数据。我们举一个具体的案例来讲解一下:...原创 2021-08-26 18:43:46 · 2365 阅读 · 4 评论 -
Hive中的数据类型
一、基本数据类型 数据类型 长度 例子 TINYINT 1byte有符号整数 20 SMALINT 2byte有符号整数 20 INT 4byte有符号整数 20 BIGINT 8byte有符号整数 2原创 2021-08-20 13:55:31 · 648 阅读 · 3 评论