
hive
Fantastic_Liar
一个90后程序猿,数据分析师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
用户留存模型
– 数据准备(这里应该是分区表,每个分区存放当天活跃用户id,为图方便放在了一个表里)– 创建hive表CREATE TABLE `active`( `id` string, `ds` string)ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'WITH SERDEPROPERTIES ( 'field.delim'='\t')STORED AS INPUTFORMAT 'org.ap原创 2020-11-23 21:14:29 · 776 阅读 · 1 评论 -
Hive中利用正则表达式过滤列名
Hive中利用正则表达式过滤列名Hive 0.13.0之后,select列表支持正则表达式了,如果想要查询除了某个列以外的其他字段的内容,可以使用以下方式,而不是把字段名全部敲出来了。select `(col_name1|col_name2|col_name3)?+.+` from table;其中col_name* 是指不要查询的列名。...转载 2019-07-26 13:19:04 · 2868 阅读 · 1 评论 -
hive UTC时间转中国时间
在hive中处理UTC时间将 2019-09-28T15:59:50.534944805Z 时区为0的时间 -> 转为东8区时间 2019-09-29 00:01:30from_unixtime(unix_timestamp(regexp_replace(regexp_replace(get_json_object(content,'$.time'),'T',' '),'Z',' ')...原创 2019-09-29 20:35:36 · 3394 阅读 · 0 评论