Hive远程模式部署参考:
一、Hive数据仓库应用之Hive部署(超详细步骤指导操作,WIN10,VMware Workstation 15.5 PRO,CentOS-6.7)
文章目录
一、加载文件
加载文件的语法格式如下:
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE]
INTO TABLE table_name [PARTITION (partcol1=val1, partcol2=val2 ...)]
1、通过加载文件的方式向外部表external_table中加载数据
创建文件夹hive_data,用于存放加载的文件。
mkdir -p /export/data/hive_data
在/export/data/hive_data目录下执行“vi staff_data
”命令,创建并编辑文件
staff_data,在文件中添加如下内容。
001,xiaoming,8000,music_game,late:100_unpaidleave:500,hui long guan_beijing
002,xiaohong,9000,run_gourmet,late:50_unpaidleave:0,xi er qi_beijing
003,zhangsan,10000,swim_basketball_travel,late:0_unpaidleave:300,yong feng_beijing
在HDFS创建目录/hive_data/staff,用于存放文件staff_data。
hdfs dfs -mkdir -p /hive_data/staff
将文件staff_data上传到HDFS的/hive_data/staff目录。
hdfs dfs -put /export/data/hive_data/staff_data /hive_data/staff
向数据库hive_database的外部表external_table加载文件staff_data。
LOAD DATA INPATH '/hive_data/staff/staff_data' OVERWRITE INTO TABLE hive_database.external_table;
2、向分区表加载文件
在/export/data/hive_data目录下执行“vi username_data”命令,创建并编辑文件username_data,在文件中添加如下内容。
username01,20
username02,24
username03,50
username04,33
username05,26
username06,27
实现向数据库hive_database的分区表partitioned_table加载文件username_data,将文件中的数据加载到分区表partitioned_table的二级分区province=ShanDong/city=JiNan,具体命令如下。
LOAD DATA LOCAL INPATH '/export/data/hive_data/username_data' OVERWRITE
INTO TABLE hive_database.partitioned_table
PARTITION (province='ShanDong', city='JiNan');
二、基本查询
基本查询的语法格式如下:
SELECT select_expr FROM table_name [WHERE where_condition];
例:查询数据库hive_database中分区表partitioned_table的列username和分区字段city数据。
SELECT username,city FROM
hive_database.partitioned_table WHERE
province='ShanDong' and city=