hive导入CSV格式的数据

本文介绍了如何在Hive中导入和处理CSV格式的数据,包括通过预处理CSV文件、定义RegexSerDe以及加载数据到表中的详细步骤,最终成功查询到处理后的数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

解决方法有几种
1),对csv文件做处理
2),hive定义inputstream,用正则表达式处理

2.1)cat /home/alex/test/testdata.txt
"1","alex","dba"
"2","james","dba"

2.2)hive> create table test_serde(c1 string,c2 string, c3 string) ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe' WITH SERDEPROPERTIES ('input.regex' = '\"(.*)\",\"(.*)\",\"(.*)\"','output.format.string' = '%1$s\\001%2$s\\001%3$s') STORED AS TEXTFILE;
OK
Time taken: 0.09 seconds

2.3)hive> load data local inpath '/home/alex/test/testdata.txt' overwrite into table test_serde; Copying data from file:/home/alex/test/testdata.txt
Copying file: file:/home/alex/test/testdata.txt
Loading data to table default.test_serde
OK
Time taken: 0.185 seconds
2.4)hive> select * from test_serde; OK
1 alex dba
2 james dba
Time taken: 0.057 seconds, Fetched: 2 row(s)
hive导入csv数据主要有以下两种方法: 1. 使用LOAD DATA命令导入csv数据 步骤如下: (1)创建数据表 首先需要在hive中创建一个数据表,表的结构应该与csv文件中的数据结构相匹配,例如: ``` CREATE TABLE mytable ( id INT, name STRING, age INT, gender STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' STORED AS TEXTFILE; ``` (2)将csv文件上传到HDFS上 使用hadoop fs -put命令将csv文件上传到HDFS上,例如: ``` hadoop fs -put /local/path/to/myfile.csv /hdfs/path/to/myfile.csv ``` (3)使用LOAD DATA命令导入csv数据 使用LOAD DATA命令将csv数据导入hive表中,例如: ``` LOAD DATA INPATH '/hdfs/path/to/myfile.csv' INTO TABLE mytable; ``` 2. 使用EXTERNAL TABLE导入csv数据 步骤如下: (1)创建外部表 首先需要在hive中创建一个外部表,外部表的结构应该与csv文件中的数据结构相匹配,例如: ``` CREATE EXTERNAL TABLE mytable ( id INT, name STRING, age INT, gender STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' LOCATION '/hdfs/path/to/myfile.csv'; ``` (2)将csv文件上传到HDFS上 使用hadoop fs -put命令将csv文件上传到HDFS上,例如: ``` hadoop fs -put /local/path/to/myfile.csv /hdfs/path/to/myfile.csv ``` (3)查询外部表 使用SELECT语句查询外部表,hive会自动读取HDFS上的csv文件并将其解析成表格数据,例如: ``` SELECT * FROM mytable; ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值