再进行数据分析的时候,再讲数据导入到hive表里面创建数据表的常用有两种方式:
1.启动Hive在Hive里面创建数据表
例如将people.csv文件导入创建的数据表people1中
CREATE TABLE IF NOT EXISTS person_data (
height INT,
weight INT,
age INT)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','//设置分割符,csv默认是,
STORED AS TEXTFILE//防止文件导入不到数据库,将数据以纯文本的形式存储在文件中
TBLPROPERTIES ("skip.header.line.count"="1");//跳过第一行(通常是表头)
将数据导入load data local inpath '/opt/data/people1.csv' overwrite into table people1;
2.直接在linux命令行创建表
编写脚本文件csv2hive.hql ,来创建数据表。//脚本文件可以写多个创建表的语句,同时创建多个数据表

脚本文件可以放到放到opt/data目录下面(存放位置随意)可以不进入Hive执行HQL命令

Hive数据导入与表创建方法,
4272

被折叠的 条评论
为什么被折叠?



