hive 集群内复制数据库

最新推荐文章于 2024-08-18 22:16:57 发布

原创最新推荐文章于 2024-08-18 22:16:57 发布 · 786 阅读

CC 4.0 BY-SA版权

文章标签：

2 篇文章

订阅专栏

本文介绍了如何在Hive集群内，通过创建新数据库、批量创建表、数据迁移、修复元数据等方式，实现多个项目对同一数据结构的独立操作，确保数据隔离且高效管理。

部署运行你感兴趣的模型镜像

工作中碰到几个外部项目使用相同数据库结构和基础数据的数据库
为了每个项目的数据独立性
可复制数据库出来给每个项目单独操作

创建数据库
create database if not exists new_db_name;
编写建表语句，表比较多的可以将表名全部拿出来后使用shell或python处理成创建表的文本
use new_db_name;
create table table_name like old_db_name.table_name;
复制数据到新的warehouse目录
hadoop fs -cp /user/hive/warehouse/old_db_name.db/* /user/hive/warehouse/new_db_name.db/
在新数据库中修复表的元数据
use new_db_name;
MSCK REPAIR TABLE table_name;

您可能感兴趣的与本文相关的镜像