hive 表加载hdfs数据
情况1:
创建内部表
create table if not exists tmp.testa (merchant_id string) stored as parquet;

加载前hdfs数据
导入数据
LOAD DATA INPATH ‘/hive_log/basis_report_data/2021-02-01’ INTO TABLE tmp.testa

总结:创建内部表 load 数据 hdfs数据会进行迁移 迁移位置 到了 hive表目录/user/hive/warehouse/tmp.db
情况二
创建外部表
create external table if not exists tmp.testb (merchant_id string) stored as parquet;
加载前hdfs数据

LOAD DATA INPATH ‘/hive_log/basis_report_data/2021-02-02’ INTO TABLE tmp.testb

总结:创建内部表 load 数据 hdfs数据会进行迁移 迁移位置 到了 hi

本文详细介绍了Hive中内部表和外部表加载HDFS数据的情况。对于内部表,LOAD DATA操作会导致HDFS数据移动到hive表目录/user/hive/warehouse下;而外部表则保持数据在原有HDFS路径不变。通过直接指定location,无论内部还是外部表,数据位置都不会受到影响。
最低0.47元/天 解锁文章
7083

被折叠的 条评论
为什么被折叠?



