
hive
haijiege
这个作者很懒,什么都没留下…
展开
-
Hive中小表与大表关联(join)的性能分析(转)
转自:http://blog.sina.com.cn/s/blog_6ff05a2c01016j7n.html经常看到一些Hive优化的建议中说当小表与大表做关联时,把小表写在前面,这样可以使Hive的关联速度更快,提到的原因都是说因为小表可以先放到内存中,然后大表的每条记录再去内存中检测,最终完成关联查询。这样的原因看似合理,但是仔细推敲,又站不住脚跟。多小的表算小表?如果所谓的小表在内...转载 2019-12-11 15:22:13 · 1930 阅读 · 0 评论 -
ROW_NUMBER() OVER()函数用法详解(转)
语法格式:row_number() over(partition by 分组列 order by排序列 desc)row_number() over()分组排序功能:在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where 、group by、order by 的执行。例一:表数据:create table TEST_R...转载 2019-04-24 15:51:18 · 6300 阅读 · 0 评论 -
hive中显示当前使用的数据库
在 hive命令行不知道当前数据库有时会带来麻烦。1、可以在hive命令行执行以下语句显示当前数据库:select current_database();2、可以设置hive属性在命令行显示当前数据库:set hive.cli.print.current.db=true;...原创 2019-01-02 11:43:07 · 5014 阅读 · 0 评论 -
hive恢复drop table数据
hive 中使用truncate命令将表截断的话,它是不会进回收站的,是没办法恢复的。这个跟oracle truncate有点类似的。 恢复在hive中通过drop table删除的数据文件就是将hdfs dfs -rm删除掉的文件进行恢复,只需要hdfs dfs -mv将文件从回收站中搬过来就行,我就先使用这个方法,但是效果不佳,执行select count(*) from ta...原创 2018-11-02 17:50:47 · 6786 阅读 · 0 评论 -
Hive学习之路 Hive中文乱码
目录Hive注释中文乱码 针对元数据库metastore中的表,分区,视图的编码设置 1、进入数据库 Metastore 中执行以下 5 条 SQL 语句 2、修改 metastore 的连接 URL 验证 正文回到顶部Hive注释中文乱码创建表的时候,comment说明字段包含中文,表成功创建成功之后,中文说明显示乱码create externa...转载 2018-09-14 10:43:37 · 719 阅读 · 0 评论 -
Hive的三种安装方式(内嵌模式,本地模式远程模式)
一、安装模式介绍: Hive官网上介绍了Hive的3种安装方式,分别对应不同的应用场景。 1、内嵌模式(元数据保村在内嵌的derby种,允许一个会话链接,尝试多个会话链接时会报错) 2、本地模式(本地安装mysql 替代derby存储元数据) 3、远程模式(远程安装mysql 替代derby存储元数据)二、安装环境以及前提说明: 首先,Hive...转载 2018-09-11 11:30:00 · 5381 阅读 · 1 评论 -
Hive 实现 IN 和 NOT IN 子句 和 LEFT SEMI JOIN 应用
目前hive不支持 in或not in 中包含查询子句的语法,所以只能通过left join实现。假设有一个用户浏览商品表skim,和一个用户购买商品表buy。如下skim表userIditemIdtime0013422015-05-080023822015-05-090034582015-05-090044682015-05-09buy表userIditemIdtime0013422015-05...原创 2018-05-23 17:55:39 · 5666 阅读 · 0 评论 -
Hive几种数据导出方式
转自:http://www.iteblog.com/archives/955谈到了Hive中几种数据的导入方式,不同的数据导入方式用途不一样。今天我们再谈谈Hive中的几种不同的数据导出方式。可以根据导出的地方不一样,将这些方式分为三种:(1)、导出到本地文件系统;(2)、导出到HDFS中;(3)、导出到Hive的另一个表中。为了避免单纯的文字,我将一步一步地用命令进行说明。 一、导出到...原创 2017-09-27 15:03:49 · 970 阅读 · 0 评论 -
hive 查找函数并查看函数使用方法
1. 查看month 相关的函数show functions like '*month*'输出如下:2.查看 add_months 函数的用法desc function add_months;3. 查看 add_months 函数的详细说明并举例desc function extended add_months;原创 2017-12-21 18:08:23 · 21653 阅读 · 2 评论 -
HIVE四种数据导入方式
Hive的几种常见的数据导入方式这里介绍四种:(1)、从本地文件系统中导入数据到Hive表;(2)、从HDFS上导入数据到Hive表;(3)、从别的表中查询出相应的数据并导入到Hive表中;(4)、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。一、从本地文件系统中导入数据到Hive表先在Hive里面创建好表,如下:转载 2017-09-18 18:19:55 · 1857 阅读 · 0 评论