将传统数仓(mysql)数据导入hive中

步骤:

一:建表

1. 获取建表语句(例dim_area),代码如下

注意:如果不设置建表格式为orc文件,txt文件load data 到orc中会出错。

 

2.做部分修改后获得如下

create table dim_area(AreaId int,AreaName string,ParentId int,Short string,IsActive int,FullName string,start_date string,end_date string)clustered by (AreaId) into 8 buckets stored as orc tblproperties('transactional=true');

二:数据导入临时表(dim_area_tmp)之后直接写入表(dim_area)通过类似于sql语法的方式导入

1.利用sqoop组件导入hive中某数据库的dim_area_tmp表中,代码如下(通过kettle中shell组件实现,写成一行代码)

2.将临时表(dim_area_tmp)数据导入目标表(dim_area)中,代码如下

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值