1. Hive中的 DDL 定义表(创建表 创建库) DML 修改表 DQL 查询表
***把hdfs中海量的数据查询出来,这才是目的
给hive表添加数据
- insert into t1 values('admin',12)(不推荐使用);
- 直接给hdfs中添加文件即可(不推荐使用) hdfs dfs -put users.csv /user/hive/warehouse/db1.db/t3(不推荐使用)
- load data [local] inpath '/root/users.csv' into table t3;(不推荐使用,但是开发阶段使用较多)
2. Hive中的复合数据类型
2.1 数组类型array
- 数据格式
admin,12,java1-python1-java
admin1,11,java-python1-java
admin2,312,java-python-java
- 创建表
create table t4(name string,age int,loves array<string>) row format delimited fields terminated by ',' collection items terminated by '-' lines terminated by '\n' ;
- 加载数据
- load data local inpath '/root/users04.csv' into table t4;
2.2 map类型
- 数据格式
小明,12,数学:20,男
小红,21,数学:22,女
大胖,25,数学:30,男
- 创建表
create table t5(name string,age int,score map<string,int>) row format delimited fields terminated by ',' map keys terminated by ':' lines terminated by '\n'
- 加载数据
- load data local inpath '/root/users05.csv' into table t5;
2.3 struct类型(相当于给数组给定了名称)
- 数据格式
小明,10:男
小花,10:女
大胖,10:男
- 创建表
create table t6(name string ,info struct<age:int,sex:string>) row format delimited fie
lds terminated by ',' collection items terminated by ':';
- 加载数据
load data local inpath '/root/users06.csv' into table t6;
- 查询
select info.age from t6;
本文详细介绍了Hive中的数据操作,包括DDL(定义表、创建库)、DML(修改表)和DQL(查询表),并重点讨论了Hive的复合数据类型,如数组(array)、映射(map)和结构(struct)的创建、加载数据及查询示例。
5503

被折叠的 条评论
为什么被折叠?



