个人认为Hive常用到的SQL命令

最新推荐文章于 2025-06-05 09:43:43 发布

翻译最新推荐文章于 2025-06-05 09:43:43 发布 · 362 阅读

·

1

·

文章标签：

#hadoop #云计算 #hive #sql

本文介绍Hive SQL的基本操作，包括创建表、添加列、删除表等，并展示了如何通过SQL进行数据查询及统计分析。还提供了加载数据到表、输出查询结果等实用技巧。

为了更好的使用我们延云YDB产品需要了解很多跟hadoop相关的知识，为了更好的使用spark这里先了解了解hive常用的SQL跟大家分享下

1.创建表 hive> CREATE TABLE pokes (foo INT, bar STRING);

2.创建表并创建索引字段ds hive> CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING);

3. 按正条件（正则表达式）显示表， hive> SHOW TABLES '.*s';

4.表添加一列 hive> ALTER TABLE pokes ADD COLUMNS (new_col INT);

5.更改表名 hive> ALTER TABLE events RENAME TO 3koobecaf;

6.删除列 hive> DROP TABLE pokes;

7.将文件中的数据加载到表中 hive> LOAD DATA LOCAL INPATH './examples/files/kv1.txt' OVERWRITE INTO TABLE pokes;

8.加载本地数据，同时给定分区信息 hive> LOAD DATA LOCAL INPATH './examples/files/kv2.txt' OVERWRITE INTO TABLE invites PARTITION (ds='2008-08-15');

9. SQL 操作按先件查询 hive> SELECT a.foo FROM invites a WHERE a.ds='<DATE>';

10.将查询数据输出至目录 hive> INSERT OVERWRITE DIRECTORY '/tmp/hdfs_out' SELECT a.* FROM invites a WHERE a.ds='<DATE>';

11.将查询结果输出至本地目录 hive> INSERT OVERWRITE LOCAL DIRECTORY '/tmp/local_out' SELECT a.* FROM pokes a;

12.将一个表的统计结果插入另一个表中 hive> FROM invites a INSERT OVERWRITE TABLE events SELECT a.bar, count(1) WHERE a.foo > 0 GROUP BY a.bar; hive> INSERT OVERWRITE TABLE events SELECT a.bar, count(1) FROM invites a WHERE a.foo > 0 GROUP BY a.bar; JOIN hive> FROM pokes t1 JOIN invites t2 ON (t1.bar = t2.bar) INSERT OVERWRITE TABLE events SELECT t1.bar, t1.foo, t2.foo;

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。