前言
Hive 是一个基于 Hadoop 的数据仓库工具,本身并不存储数据,它会表数据存放到 hdfs 中,并利用自带的 sql 解析引擎,将 sql 语句转换成 mr job ,在 hadoop 的 mapreduce 引擎上对数据进行查询、统计和分析。
内部表和外部表最根本的区别在于,是否由Hive管理表的全生命周期。例如,Hive 管理内部表的元数据以及实际的表数据,而对于外部表,则只管理它的元数据。
一、建表语句的区别
外部表的建表语句需要被 external 修饰,但是内部表是不需要的。
- 外部表 - 被 external 修饰
create external table if not exists table_name(
prd_wid bigint comment '时间维度'
,w_insert_dt string comment '数据仓库插入时间'
,name string comment '名称'
,age bigint comment '年龄'
)comment '外部表'
partitioned by (dt string)
row format delimited fields terminated by '\t'
stored as parquet
;
- 内部表
订阅专栏 解锁全文
1003

被折叠的 条评论
为什么被折叠?



