
Hive
冰阔落
Stay hungry, Stay foolish, Stop when you are perfect.
展开
-
hive 函数--多行数据转化成 map 类型
最近工作中向别的部门提供接口数据时有这样的需求将下面的表格形式的数据的后两列输出为map形式即这个形式:然后用这个函数处理:str_to_map(concat_ws(',',collect_set(concat_ws(':',a.寄件省份,cast(a.件量 as string))))) as 寄件省份件量...转载 2019-12-31 11:26:16 · 1829 阅读 · 0 评论 -
Hive修改表名,列名,列注释,表注释,增加列,调整列顺序,属性名等操作
refer1:https://blog.youkuaiyun.com/xiaolang85/article/details/21637827Alter Table 语句Hive修改表名,列名,列注释,表注释,增加列,调整列顺序,属性名等操作它是在Hive中用来修改的表。语法:声明接受任意属性,我们希望在一个表中修改以下语法。ALTER TABLE...转载 2019-08-14 11:27:14 · 357 阅读 · 0 评论 -
hive 空值判断
hive中空值判断基本分两种:1、NULL 与 \Nhive在底层数据中如何保存和标识NULL,是由 alter table name SET SERDEPROPERTIES('serialization.null.format' = '\N'); 参数控制的比如: (1).设置 alter table name SET SERDEPROPERTIES...转载 2018-09-04 18:33:30 · 7137 阅读 · 0 评论 -
Hive 中对 json 处理
应用场景:使用Hive对日志信息进行查询分解,log里面记录的是json形式的数据:{"logid":"5d40e1af-19f7-4aad-af8f-c7247e322e5c","souc":"4","devi":"OPPO R7sm","sys":"22,5.1.1","dname":"Dalvik/2.1.0转载 2018-09-04 17:57:29 · 829 阅读 · 0 评论 -
hive 中 json 字符串解析之 get_json_object 与 json_tuple
在技术对app进行埋点时,会讲多个字段存放在一个数组中,因此模型调用数据时,要对埋点数据进行解析,以作进一步的清洗。本文将介绍解析json字符串的两个函数:get_json_object和json_tuple。表结构如下:一、get_json_object函数的作用:用来解析json字符串的一个字段:select get_json_object(flist,'$.fi...转载 2018-09-04 17:45:35 · 5051 阅读 · 1 评论 -
在纯 hive SQL 中创建时间维度表
Without further ado, here is the full SQL to create a table giving you a table with one row per day, with date, year, mont, day, day and name of the week, day of the year. If you want the hours as wel...转载 2018-09-04 17:04:37 · 5920 阅读 · 1 评论 -
Automatic Partitioning With Amazon Athena
Automatic Partitioning With Amazon Athena Amazon Athena pricing is based on the bytes scanned. Anything you can do to reduce the amount of data that’s being scanned wi...转载 2018-05-04 18:06:51 · 493 阅读 · 0 评论 -
hive 修改表/分区语句
这里主要列一些常用操作。添加分区ALTER TABLE table_name ADD PARTITION (partCol = 'value1') location 'loc1'; //示例ALTER TABLE table_name ADD IF NOT EXISTS PARTITION (dt='20130101') LOCATION '/user/hadoop/warehouse转载 2017-09-22 16:20:27 · 770 阅读 · 0 评论 -
Hive实现从表中随机抽样得到一个不重复的数据样本
Hive实现从表中随机抽样得到一个不重复的数据样本方法一:[sql] view plain copy select * from table_a order by rand() limit 100; 方法二:[sql] view plain copy select * from ( s转载 2017-07-25 17:20:33 · 4689 阅读 · 0 评论 -
Hive 取非 Group by 字段数据的方法
遇到这么一个需求,输入数据为一个ID对应多个name,要求输出数据为ID是唯一的,name随便取一个就可以。执行以下Hive ql语句:123456SELECT sid, class_id FROM table2 GROUP BY sid ;会报错:转载 2017-05-08 14:21:58 · 2982 阅读 · 0 评论 -
hive 如何去掉重复数据,显示第一条
name adx tran_id cost tsck 5 125.168.10.0 33.00 1407234660ck 5 187.18.99.00 33.32 1407234661ck 5转载 2017-05-08 17:33:34 · 15509 阅读 · 0 评论 -
Hive2.0 函数大全(中文版)
摘要Hive内部提供了很多函数给开发者使用,包括数学函数,类型转换函数,条件函数,字符函数,聚合函数,表生成函数等等,这些函数都统称为内置函数。 数学函数Return TypeName (Signature)DescriptionDOUBLEround(DOU转载 2017-07-20 14:47:50 · 640 阅读 · 0 评论