
hive
说的对
这个作者很懒,什么都没留下…
展开
-
hive sql 多行转为一行&&collect_set&&collect_list的区别
1.collect_list 多行转一行,有序不去重数据select 123 uid,'a' name, int(1) typefrom tunion allselect 123 uid,'b' name, int(2) typefrom tunion allselect 123 uid,'c' name, int(3) typefrom tunion allselec...原创 2020-01-10 17:12:18 · 561 阅读 · 0 评论 -
常用hive函数集锦
一、关系函数1.等值比較:= 语法:A=B操作类型:全部基本类型2.不等值比較:<> 语法:A<>B 操作类型:全部基本类型3.小于比較:< 语法:A<B操作类型:全部基本类型4.空值推断:IS NULL 语法:a is null操作类型:全部类型5.非空推断:IS NOT NULL 语法:a is...翻译 2018-12-07 11:32:58 · 222 阅读 · 0 评论 -
crontab 定时任务执行sqoop任务脚本,无法查看运行日志
前段时间于到一个关于crontab定时任务的问题:问题是这样的我通过sqoop命令将mysql数据库数据同步到hive表,linux命令行执行没毛病,写成shell脚本,做crontab定时任务,发现执行不成功。tail -f /var/log/cron 执行正常。tail -f /var/mail/spool/work 没有日志输出。(我是work用户执行)其实是sqoo...原创 2018-12-27 11:17:02 · 2267 阅读 · 0 评论 -
hivesql删除数据、删除分区表、删除库表
-- 删除库drop database [if exists] db_name;-- 强制删除库drop database [if exists] db_name cascade;-- 删除表drop table [if exists] table_name; -- 清空表,第二种方式insert overwrite table_name select * from...原创 2019-01-04 10:51:50 · 8174 阅读 · 0 评论 -
hive 添加,修改,删除字段的坑
alter table table_name add columns(location_id string) ;alter table table_name change column complete_status complete_status string;使用alter table语句更新变结构时,由于默认更行现有表结构,对历史分区表元数据无改动,导致原有分区变数据,新字段...原创 2019-01-23 16:53:20 · 38901 阅读 · 2 评论 -
hive中对json字符串的解析-get_json_object和json_tuple的对比
在技术对app进行埋点时,会讲多个字段存放在一个数组中,因此模型调用数据时,要对埋点数据进行解析,以作进一步的清洗。本文将介绍解析json字符串的两个函数:get_json_object和json_tuple。表结构如下:一、get_json_object函数的作用:用来解析json字符串的一个字段:select get_json_object(flist,'$.fi...转载 2019-02-25 18:41:52 · 817 阅读 · 0 评论 -
sql的开窗函数over()
sql的一大神器就是over()开窗函数,以前我经常使用的就是row_number() over(partition by rowName order by rowName)别的都不熟悉,今天特简单做个总结,以便以后使用。数据排序使用row_number() over(partition by rowName ORDER BY rowName) row_number 的功能是为从第一行...原创 2019-06-18 20:34:40 · 1755 阅读 · 0 评论 -
sql实现递归累加的三种方法
有如下表:Tdate number 2019-01-01 20 2019-01-02 15 2019-01-03 10 2019-01-04 21 2019-01-05 88 2019-01-06 60 实现number按时间累加输出:date number 2019-01-01 20 2019-...原创 2019-07-26 19:14:09 · 8046 阅读 · 4 评论