excel数据导入hive

本文介绍如何将Excel数据转换为文本格式,并导入Linux系统。接着通过改变编码格式和创建Hive表的方式,最终将文本数据加载到Hive表中。过程中详细说明了表结构的设计、数据格式的要求及具体操作步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 将excel数据转成文本数据(.txt)
  2. 将该txt文件导入Linux指定目录中
  3. 转换编码格式,在指定目录下执行如下命令:piconv -f gb2312 -t UTF-8 CompanyCode.txt  >  c.txt
  4. ,根据文档中的列,创建表,建表语句如下:

create external table if not exists `dwd.dwd_brand_rank_base_tmp`
(
   `category_name` string comment '品类名称',
   `category_id` string comment '品类id',
   `first_brand_name` string comment '一档品牌名称',
   `first_brand_id` string comment '一档品牌ID',
   `second_brand_name` string comment '二档品牌名称',
   `second_brand_id` string comment '二档品牌ID',
   `third_brand_name` string comment '三档品牌名称',
   `third_brand_id` string comment '三档品牌ID'
)
comment '品类品牌关系映射表'

ROW format delimited
fields terminated by '\t'
STORED AS TEXTFILE;

不能使用parquet格式,否则数据导入为空,需要指定分隔符,指定存储格式;

将c.txt文件加载到hive表CompanyCode中,

 load data local inpath '/home/hadoop/c.txt' into table CompanyCode;

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值