Hive建表

本文介绍如何创建一个名为dwh_app_logins_push_status的外部表,该表用于存储应用登录推送状态的相关数据,包括用户标识、设备信息等字段,并按天进行分区。
CREATE EXTERNAL TABLE dwh_app_logins_push_status (
    uid STRING,
    user_id STRING,
    euid STRING,
    imei STRING,
    idfa STRING,
    mac STRING,
    client STRING,
    day_now_diff_one_before STRING,
    day_one_diff_two_before STRING,
    rl_last STRING,
    rl STRING
)
PARTITIONED BY(p_day BIGINT)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe'
STORED AS RCFILE LOCATION '/user/hive/warehouse/dg/bigtables/dwh_app_logins_push_status';`
Hive 是一个基于 Hadoop 的数据仓库工具,可以通过类 SQL 语言来查询和分析数据。下面是 Hive 的基本语法: ``` CREATE TABLE [IF NOT EXISTS] table_name ( column1 data_type [COMMENT col_comment], column2 data_type [COMMENT col_comment], ... ) [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] [ROW FORMAT row_format] [STORED AS file_format] [TBLPROPERTIES (property_name=property_value, ...)] ``` 其中,各个参数的含义如下: - `IF NOT EXISTS`:可选参数,示如果已经存在,则不执行创操作。 - `table_name`:要创的名称。 - `column1, column2, ...`:的列名及其对应的数据类型。 - `COMMENT`:列注释或注释。 - `PARTITIONED BY`:可选参数,示按照哪些列进行分区。 - `ROW FORMAT`:可选参数,指定行的格式,如 `DELIMITED FIELDS TERMINATED BY ','`。 - `STORED AS`:可选参数,指定的存储格式,如 `TEXTFILE`, `ORC`, `PARQUET` 等。 - `TBLPROPERTIES`:可选参数,用于设置的属性,如 `LOCATION`、`SERDE`、`INPUTFORMAT`、`OUTPUTFORMAT` 等。 例如,我们创一个学生,包含学号、姓名、年龄三个字段,其中学号为 int 类型,姓名和年龄为 string 类型,可以使用以下语句: ``` CREATE TABLE IF NOT EXISTS student ( id INT COMMENT '学号', name STRING COMMENT '姓名', age STRING COMMENT '年龄' ) COMMENT '学生' ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE; ``` 这样就创了一个名为 `student` 的,包含 `id`、`name`、`age` 三个字段。其中,`COMMENT` 用于设置列或的注释,`ROW FORMAT` 用于设置行的分隔符,`STORED AS` 用于设置的存储格式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值