excel文件导入hive

本文详细介绍了一种将Excel数据转换并导入Hive数据库的方法,包括文件格式转换、编码调整、表结构创建及数据加载过程,确保数据完整性和正确性。

步骤一:将excel另存为txt文档(文本文件(制表符分割))假设名字为CompanyCode.txt 步骤二,将该txt文件导入Linux指定目录中
步骤三,转换编码格式,在指定目录下执行如下命令:piconv -f gb2312 -t UTF-8 CompanyCode.txt > c.txt
步骤四,根据文档中的列,创建表,建表语句如下: hive> create table CompanyCode ( > CCN String, > Subsidiary String, > SaleArea String, > region String, > CorporateName String, > CorporateNameIT String, > Remarks String) > ROW format delimited > fields terminated by ‘\t’ > STORED AS TEXTFILE;
步骤五:将c.txt文件加载到hive表CompanyCode中 hive> load data local inpath ‘/home/hadoop/c.txt’ into table CompanyCode; Loading data to table default.companycode Table default.companycode stats: [numFiles=1, totalSize=3711] OK Time taken: 0.826 seconds
步骤六:验证 hive> select * from CompanyCode;
注意观察: 1. 验证数据是否上传成功 2. 若没有数据,查看所有数据是否都保存在第一列 3. 有数据,是否正常,是否出现串列现象

要将Excel导入Hive,首先需要将Excel文件转换为Linux系统能够读取的txt格式文件。然后,将这个txt文件导入到HDFS文件系统中。接下来,根据Excel中的数据结构,在Hive中创建相应的表,并确保结构顺序一致。最后,使用load命令将HDFS文件中的数据导入Hive表中。具体代码如下: 1. 转换Excel为txt格式文件导入到HDFS文件系统中: - 可以使用Python或其他工具将Excel文件转换为txt格式文件,并将其上传到HDFS文件系统中。 - 假设Excel文件已经转换为名为ods_tj_farm_feed.txt的txt文件,并上传到HDFS的/tmp目录下。 2. 在Hive中创建表: - 根据Excel中的数据结构,在Hive中创建相应的表。例如,可以使用以下代码创建名为ods_tj_farm_feed的表: ``` CREATE TABLE ods_tj_farm_feed ( column1 datatype1, column2 datatype2, ... ); ``` 3. 使用load命令将数据导入Hive表: - 可以使用以下命令将/tmp/ods_tj_farm_feed.txt文件中的数据导入到ods_tj_farm_feed表中: ``` LOAD DATA INPATH '/tmp/ods_tj_farm_feed.txt' INTO TABLE ods_tj_farm_feed; ``` 通过以上步骤,可以将Excel数据成功导入Hive表中。请注意,具体的文件路径和表结构需要根据实际情况进行设置和调整。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Excel文件导入hive](https://blog.youkuaiyun.com/qq_41495340/article/details/118177209)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [python处理数据,存进hive表的方法](https://download.youkuaiyun.com/download/weixin_38717574/12867789)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值