【HIVE】hive两种创建表常用组合

最新推荐文章于 2024-04-29 11:58:44 发布

原创最新推荐文章于 2024-04-29 11:58:44 发布 · 608 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#HIVE

Hive 专栏收录该内容

8 篇文章

订阅专栏

博客介绍了Hive的常用组合，包括parquet格式与snappy压缩的组合，以及ORC格式与snappy压缩的组合，为Hive数据存储和处理提供参考。

常用组合：parquet 格式 + snappy 压缩

set parquet.compression=snappy;
 CREATE TABLE db_name.tb_name(
id              STRING
)
PARTITIONED BY (date_str STRING ,hour_str STRING )
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' 
LINES TERMINATED BY '\n'
STORED AS PARQUET;

常用组合：ORC 格式 + snappy 压缩

CREATE TABLE db_name.tb_name(
id              STRING
)
PARTITIONED BY (date_str STRING ,hour_str STRING )
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' 
LINES TERMINATED BY '\n'
STORED AS ORC
TBLPROPERTIES ("orc.compress"="SNAPPY") ;