hive作为数仓,分为 1、业务数据的数仓,来源于mysql
2、用户行为数仓(日志),来源于采集系
hive :
ods层:用sqoop将mysql的数据导入到hdfs
创建Snappy压缩格式的Parquet结构的表
drop table if exists ods_order_info;
create table ods_order_info (
id
string COMMENT ‘订单编号’,
total_amount
decimal(10,2) COMMENT ‘订单金额’,
order_status
string COMMENT ‘订单状态’,
…
) COMMENT ‘订单表’
PARTITIONED BY ( dt
string)
row format delimited fields terminated by ‘\t’
location ‘/warehouse/gmall/ods/ods_order_info/’
tblproperties (“parquet.compression”=“snappy”)
日志:
drop table if exists ods_start_log;
CREATE EXTERNAL TABLE ods_start_log
(line
string)
PARTITIONED BY (dt
string)
STORED AS
INPUTFORMAT ‘com.hadoop.mapred.DeprecatedLzoTextInputFormat’
OUTPUTFORMAT 'org.apache.ha
hive作为数仓,各个层次的存储格式
最新推荐文章于 2025-02-10 14:47:27 发布