导入数据:
1、load data local inpath ‘本地虚假机文件路径’ into table 数据库(.)表名;
将本地的数据导入到hive中
从hdfs集群导入数据
2、load data inpath ‘hdfs://虚拟机名称:9000/user/tes.txt’ into table test.te;
创建表:
内部表–删除之后数据全部丢失
外部表–删除元数据之后源数据还存在
1、结构一样,但是数据不一样 ----like
create table bws like te;
2、结构一样,数据也一样----as
create table bws2 as select * from tes;
ROW FORMAT DELIMITED : 行格式分隔
FIELDS TERMINATED BY ’,’ : 字段之间使用空格分隔
COLLECTION ITEMS TERMINATED BY ‘-’ : 集合(就是这的数据)使用逗号分隔
MAP KEYS TERMINATED BY ‘:’ : 键值对使用冒号分隔
LINES TERMINATED BY ‘\n’ : 记录之间使用换行符分隔
课下作业:
create table psn1(
id int,
name varchar(11),
hobby arrays,
address map<string,string>
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ’,’
COLLECTION ITEMS TERMINATED BY ‘-’
MAP KEYS TERMINATED BY ‘:’ :
LINES TERMINATED BY ‘\n’
数据格式:
11,小明11,lol-book-movie,beijing:bawei-shanghai:putdong
11,小明12,lol-book-movie,beijing:bawei-shanghai:putdong

本文介绍了Hive中的数据导入方法,包括从本地和HDFS导入。接着详细讲解了创建内部表和外部表的语法,并通过示例展示了如何创建分隔符定制的复杂数据格式表。同时,提到了Hive的分区表概念,包括静态和动态分区的创建。最后,讨论了Hive的临时表和桶表,以及如何进行数据抽样。
最低0.47元/天 解锁文章
2442

被折叠的 条评论
为什么被折叠?



