DML

最新推荐文章于 2024-03-22 23:04:10 发布

原创最新推荐文章于 2024-03-22 23:04:10 发布 · 306 阅读

0 ·

CC 4.0 BY-SA版权

hive 专栏收录该内容

4 篇文章

订阅专栏

本文深入解析Hive SQL的基本操作，包括数据加载、插入、更新及复杂查询，如使用case语句进行条件判断，利用内置函数处理数据，以及通过分组聚合实现高级数据分析。同时，介绍了Hive特有的wordcount实现过程，展示了从行到列的数据转换技巧。

Load

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]

create table dept(
deptno int,
dname string,
location string
) row format delimited fields terminated by '\t';


LOAD DATA LOCAL INPATH '/home/hadoop/data/dept.txt' OVERWRITE INTO TABLE dept;

Overwrite 会删除原数据（覆盖），不加的话会add数据到table（添加）；

Insert

INSERT OVERWRITE [LOCAL] DIRECTORY directory1

[ROW FORMAT row_format] [STORED AS file_format] (Note: Only available starting with Hive 0.11.0)

SELECT ... FROM ...

INSERT OVERWRITE LOCAL DIRECTORY '/home/hadoop/data/d6/emptmp'
row format delimited fields terminated by ','
SELECT empno,ename FROM emp;


create table xxx as SELECT empno,ename FROM emp;

Hive里面的SQL

跟mysql一样的：

select ename, sal,
case
when sal > 1 and sal <=1000 then 'lower'
when sal > 1000 and sal <=2000 then 'middle'
when sal > 2000 and sal <=3000 then 'high'
else 'highest' end
from emp;