Hive知识点

最新推荐文章于 2022-08-17 15:15:56 发布

原创

最新推荐文章于 2022-08-17 15:15:56 发布 · 1.4k 阅读

0 ·

CC 4.0 BY-SA版权

本文介绍了Hive的基础知识，包括元数据存储、与Hive交互的三种方式、数据类型、数据操作、分区表、存储格式和HQL。强调了Hive作为数据仓库的特点，如读时模式、支持ACID操作、动态分区以及不同存储格式的使用。

基础知识
hive需要存储模式信息和其他元数据，默认使用关系型数据库Derby SQL。它提供有限的单进程的存储服务，例如用户不可以执行两个并发的Hive CLI实例。因此对于集群和多用户并发的场景来说，需要使用MySQL或者类似的关系型数据库，只要该数据库可以使用JDBC连接即可。
conf目录下存放了Hive的配置文件，包括元数据存储方式，各种各样的优化和安全控制等等。

如何与Hive交互
有三种方式可以访问Hive：
1，交互式的命令行界面
2，使用JDBC，ODBC(由thrift实现)。即编写Java程序，调用Hive的API来执行HQL，与在Java程序中调用关系型数据库API来操作关系型数据库是一样的。
3，Hive还提供一个简单的网页界面，提供远程访问hive的服务

下面就如何使用命令行做简单的介绍：
在操作系统命令行中执行HQL