Hive 建表集合

最新推荐文章于 2024-05-02 13:32:23 发布

原创最新推荐文章于 2024-05-02 13:32:23 发布 · 267 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#hive #hadoop #big data

大数据专栏收录该内容

80 篇文章

订阅专栏

本文介绍了Hadoop大数据处理中创建简单表、外部表、分区表以及Bucket表的SQL语法。从基本的CREATE TABLE语句到复杂的分区和桶设置，详细阐述了每种类型表的用途和格式，包括存储格式、字段分隔符和位置。此外，还提及了如何创建带有索引字段的表以及复制空表的操作，为大数据环境下的数据管理提供了清晰的指导。

创建简单表：

CREATE TABLE pokes (foo INT, bar STRING);

创建外部表：

CREATE EXTERNAL TABLE page_view(viewTime INT, userid BIGINT,
page_url STRING, referrer_url STRING,
ip STRING COMMENT 'IP Address of the User',
country STRING COMMENT 'country of origination')
COMMENT 'This is the staging page view table'
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\054'
STORED AS TEXTFILE
LOCATION '<hdfs_location>';

建分区表

CREATE TABLE par_table(viewTime INT, userid BIGINT,
page_url STRING, referrer_url STRING,
ip STRING COMMENT 'IP Address of the User')
COMMENT 'This is the page view table'
PARTITIONED BY(date STRING, pos STRING)
ROW FORMAT DELIMITED ‘\’
FIELDS TERMINATED BY '\'
STORED AS SEQUENCEFILE;

建Bucket表

CREATE TABLE par_table(viewTime INT, userid BIGINT,
page_url STRING, referrer_url STRING,
ip STRING COMMENT 'IP Address of the User')
COMMENT 'This is the page view table'
PARTITIONED BY(date STRING, pos STRING)
CLUSTERED BY(userid) SORTED BY(viewTime) INTO 32 BUCKETS
ROW FORMAT DELIMITED ‘\’
FIELDS TERMINATED BY '\'
STORED AS SEQUENCEFILE;

创建表并创建索引字段

CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING);

复制一个空表

CREATE TABLE empty_key_value_store
LIKE key_value_store;