Hive 入门与配置指南
1. 简介
Hive 是一个数据仓库基础工具,它提供了简单的 SQL 查询功能来处理大规模数据集。Hive 依赖于 Hadoop 来存储和处理数据,同时需要一个元数据存储组件(metastore)来管理表结构和分区信息。
2. 启动 Hive
要启动 Hive 的命令行界面(CLI),可以使用 $HIVE_HOME/bin/hive 命令。如果已经将 $HIVE_HOME/bin 添加到系统的 PATH 环境变量中,直接输入 hive 即可启动。
以下是一个简单的启动和操作示例:
$ cd $HIVE_HOME
$ bin/hive
Hive history file=/tmp/myname/hive_job_log_myname_201201271126_1992326118.txt
hive> CREATE TABLE x (a INT);
OK
Time taken: 3.543 seconds
hive> SELECT * FROM x;
OK
Time taken: 0.231 seconds
hive> SELECT *
> FROM x;
OK
Time taken: 0.072 seconds
hive> DROP TABLE x;
OK
Time taken: 0.834 seconds
hive> exit;
$
在这个示例中,我们创建
超级会员免费看
订阅专栏 解锁全文
805

被折叠的 条评论
为什么被折叠?



