更改hive表location指向

本文档详细介绍了如何使用SQL更新Hive的location字段,以实现数据存储路径的更改,同时提供了非分区表和分区表的操作示例。此外,还展示了如何使用awss3sync命令同步S3上的数据文件,确保数据迁移的完整性和一致性。适用于大数据环境中的数据治理和迁移场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.更改DBS表中的location字段

2.更改SDS表中的location字段

非分区表:

UPDATE DBS
JOIN TBLS
JOIN SDS ON DBS.DB_ID = TBLS.DB_ID
AND TBLS.SD_ID = SDS.SD_ID
SET SDS.LOCATION = REPLACE ( `LOCATION`, '原始路径前缀', '目标路径前缀‘ )
WHERE
DBS.`NAME` = '库名'
AND TBLS.TBL_TYPE = 'MANAGED_TABLE'
AND SDS.LOCATION LIKE ’原始路径前缀%'

分区表:

UPDATE DBS
JOIN TBLS
JOIN SDS ON DBS.DB_ID = TBLS.DB_ID
AND TBLS.SD_ID = SDS.SD_ID
SET SDS.LOCATION = REPLACE ( `LOCATION`, '原始路径前缀', '目标路径前缀‘ )
WHERE
DBS.`NAME` = '库名'
AND TBLS.TBL_TYPE = 'MANAGED_TABLE'
AND SDS.LOCATION LIKE ’原始路径前缀%'

3.同步数据文件

aws s3 sync 原始路径 目标路径

示例:

aws s3 rm s3://bigdata-database-meta-cn-northwest-1-prod/globalbi.db --recursive
aws s3 sync s3://bigdata-analysis-bikpi-cn-northwest-1/prod/global/globalbi s3://bigdata-database-meta-cn-northwest-1-prod/globalbi.db

非分区表:

UPDATE DBS
    JOIN TBLS
    JOIN `PARTITIONS`
    JOIN SDS ON DBS.DB_ID = TBLS.DB_ID 
    AND TBLS.TBL_ID = `PARTITIONS`.TBL_ID 
    AND `PARTITIONS`.SD_ID = SDS.SD_ID 
SET SDS.LOCATION = REPLACE ( `LOCATION`, 's3://bigdata-analysis-bikpi-cn-northwest-1/prod/global/globalbi', 's3://bigdata-database-meta-cn-northwest-1-prod/globalbi.db' ) 
WHERE-- DBS.`NAME` = 'debi'
-- AND TBLS.TBL_TYPE = 'MANAGED_TABLE'
-- AND
SDS.LOCATION LIKE 's3://bigdata-analysis-bikpi-cn-northwest-1/prod/global/globalbi%'





SELECT
    DBS.`NAME`,
    TBLS.`TBL_NAME`,
    TBLS.TBL_TYPE,
    SDS.LOCATION 
FROM
    DBS
    JOIN TBLS
    JOIN SDS ON DBS.DB_ID = TBLS.DB_ID 
    AND TBLS.SD_ID = SDS.SD_ID 
WHERE
    DBS.`NAME` = 'globalbi' -- AND TBLS.TBL_TYPE = 'MANAGED_TABLE' 
-- AND
-- SDS.LOCATION LIKE 's3://bigdata-analysis-bikpi-cn-northwest-1/prod/global/globalbi%'
    
ORDER BY
    location

分区表:

UPDATE DBS
    JOIN TBLS
    JOIN `PARTITIONS`
    JOIN SDS ON DBS.DB_ID = TBLS.DB_ID 
    AND TBLS.TBL_ID = `PARTITIONS`.TBL_ID 
    AND `PARTITIONS`.SD_ID = SDS.SD_ID 
SET SDS.LOCATION = REPLACE ( `LOCATION`, 's3://bigdata-analysis-bikpi-cn-northwest-1/prod/global/globalbi', 's3://bigdata-database-meta-cn-northwest-1-prod/globalbi.db' )
WHERE
-- DBS.`NAME` = 'debi'
-- AND TBLS.TBL_TYPE = 'MANAGED_TABLE'
-- AND
SDS.LOCATION LIKE 's3://bigdata-analysis-bikpi-cn-northwest-1/prod/global/globalbi%'

SELECT
    DBS.`NAME`,
    TBLS.`TBL_NAME`,
    TBLS.TBL_TYPE,
    `PARTITIONS`.TBL_ID,
    `PARTITIONS`.SD_ID,
    SDS.LOCATION 
FROM
    DBS
    JOIN TBLS
    JOIN `PARTITIONS`
    JOIN SDS ON DBS.DB_ID = TBLS.DB_ID 
    AND TBLS.TBL_ID = `PARTITIONS`.TBL_ID 
    AND `PARTITIONS`.SD_ID = SDS.SD_ID 
WHERE
    DBS.`NAME` = 'globalbi' -- AND TBLS.TBL_TYPE = 'MANAGED_TABLE'
    
    AND SDS.LOCATION LIKE 's3://bigdata-analysis-bikpi-cn-northwest-1/prod/global/globalbi%
ORDER BY
    location

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值