hive
文章平均质量分 69
bsf5521
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive和impala操作parquet文件timestamp带来的困扰
前言:准备使用hive作数据仓库,因历史遗留问题,原先遗留的数据处理都是impala处理的,数据文件是parquet文件,因本身集群资源少,而处理的文件很大,准备使用hive离线分析将小文件推送到db或者impala进行展示操作。 准备:搭建cdh5.9,将原有的数据从一个集群迁移到现有的集群。对数据按照天进行动态分区,分区数据仍然使用parquet格式。 问题:因分区字段为timestamp原创 2017-05-24 17:40:16 · 3630 阅读 · 0 评论 -
CDH5.9 hive查询表注释为乱码解决方法
hive 元数据库用的是MySQL 创建表后,用desc 在hive中查看表信息,注释显示乱码。解决方案如下: 1 进入mysql ,执行 show create database hive 查看hive 数据库当前编码,如果是utf8 则执行下面sql alter database hive default character set latin1原创 2017-08-01 11:33:59 · 652 阅读 · 0 评论 -
hive 行转列 列转行操作
一、行转列的使用 1、问题 hive如何将 a b 1 a b 2 a b 3 c d 4 c d 5 c d 6 变为: a b 1,2,3 c原创 2017-08-02 13:36:27 · 3189 阅读 · 0 评论 -
hive操作-建表
Hive 建表: CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_co原创 2017-08-02 14:16:52 · 396 阅读 · 1 评论
分享