Hive 的内部表和外部表是两种管理数据的方式,核心区别在于数据的生命周期由谁控制(Hive 还是用户/外部系统)以及删除表时对数据文件的影响。理解它们的区别对于设计高效、可靠的数据仓库至关重要。
🧱 核心区别总结
| 特性 | 内部表 (Managed Table) | 外部表 (External Table) |
|---|---|---|
| 创建语法 | CREATE TABLE table_name ... |
CREATE EXTERNAL TABLE table_name ... LOCATION 'hdfs_path' |
| 数据所有权 | Hive | 用户/外部系统 |
| 存储位置 | Hive 默认仓库路径 (hive.metastore.warehouse.dir) |
必须指定 (LOCATION 子句) |
删除表 (DROP TABLE) |

最低0.47元/天 解锁文章
1166

被折叠的 条评论
为什么被折叠?



