(18)Hive ——内部表和外部表的区别?

前言

    Hive 是一个基于 Hadoop 的数据仓库工具,本身并不存储数据,它会表数据存放到 hdfs 中,并利用自带的 sql 解析引擎,将 sql 语句转换成 mr job ,在 hadoop 的 mapreduce 引擎上对数据进行查询、统计和分析。

   内部表和外部表最根本的区别在于,是否由Hive管理表的全生命周期。例如,Hive 管理内部表的元数据以及实际的表数据,而对于外部表,则只管理它的元数据。

一、建表语句的区别

外部表的建表语句需要被 external 修饰,但是内部表是不需要的。

  • 外部表 - 被 external 修饰
create external table if not exists table_name(
prd_wid        bigint comment '时间维度'
,w_insert_dt   string comment '数据仓库插入时间'
,name          string comment '名称'
,age           bigint comment '年龄'
)comment '外部表'
partitioned by (dt string)
row format delimited fields terminated by '\t'
stored as parquet
;
  • 内部表
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值