Hive的4种表结构;内部表与外部表的区别;分区表与分桶表的区别

本文详细介绍了Hive中的四种表结构:内部表、外部表、分区表和分桶表。内部表的数据由Hive管理,删除时数据也会被删除;外部表数据由HDFS管理,删除仅移除元数据。分区表按目录分区,用于提升查询效率,而分桶表按文件分桶,优化JOIN操作。分区表可进一步分桶,但分桶表无法再分区,且分桶数不可修改。了解这些概念有助于更好地管理和优化Hive数据存储。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

4种表结构:内部表,外部表,分区表,分桶表.

内部表与外部表的区别:

  • 有external关键词修饰的外部表,没有external关键词修饰的是内部表
  • 外部表的数据由HDFS管理,内部表的数据由hive自身管理
  • 删除外部表只会删除元数据信息,存储的数据不会删除;删除内部表,存储的数据与元数据信息都会被删除

分区表与分桶表的区别:

  • 数据粒度不同,分区表是针对目录进行分区,分桶表是针对文件进行分桶
  • 分区表可以进一步分桶,分桶表不可再分区
  • 分区的字段是表外的字段,分桶的字段是表中已经存在的字段
  • 分区数可以修改,分桶数修改不了
  • 分区主要是提高查询效率,分桶主要是提高join效率及进行数据采样
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值