Hive metastore三种配置方式

本文介绍了Hive元数据的三种存储方式:本地Derby、本地MySQL和远程MySQL。每种方式都提供了详细的配置示例,并说明了它们的适用场景。

Hive的meta数据支持以下三种存储方式,其中两种属于本地存储,一种为远端存储。远端存储比较适合生产环境。Hive官方wiki详细介绍了这三种方式,链接为:Hive Metastore

 

一、本地derby

这种方式是最简单的存储方式,只需要在hive-site.xml做如下配置便可

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

<property>
  <name>javax.jdo.option.ConnectionURL</name>
  <value>jdbc:derby:;databaseName=metastore_db;create=true</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionDriverName</name>
  <value>org.apache.derby.jdbc.EmbeddedDriver</value>
</property>
 
<property>
  <name>hive.metastore.local</name>
  <value>true</value>
</property>
 
<property>
  <name>hive.metastore.warehouse.dir</name>
  <value>/user/hive/warehouse</value>
</property>
 
<property>
  <name>hive.metastore.warehouse.dir</name>
  <value>/user/hive/warehouse</value>
</property>

</configuration>

注:使用derby存储方式时,运行hive会在当前目录生成 一个 derby 文件一个 metastore_db 目录。这种存储方式的 弊端是在同一个目录下同时只能有一个hive客户端能使用数据库,否则会提示如下错误

hive> show tables;
FAILED: Error in metadata: javax.jdo.JDOFatalDataStoreException: Failed to start database 'metastore_db', see the next exception for details.
NestedThrowables:
java.sql.SQLException: Failed to start database 'metastore_db', see the next exception for details.
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask

二、本地mysql

这种存储方式需要在本地运行一个mysql服务器,并作如下配置(下面两种使用mysql的方式,需要将mysql的jar包拷贝到$HIVE_HOME/lib目录下)。

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
<property>
  <name>hive.metastore.warehouse.dir</name>
  <value>/user/hive_remote/warehouse</value>
</property>
 
<property>
  <name>hive.metastore.local</name>
  <value>true</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionURL</name>
  <value>jdbc:mysql://localhost/hive_remote?createDatabaseIfNotExist=true</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionDriverName</name>
  <value>com.mysql.jdbc.Driver</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionUserName</name>
  <value>hive</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionPassword</name>
  <value>password</value>
</property>
</configuration>

三、远端mysql

这种存储方式需要在远端服务器运行一个mysql服务器,并且需要在Hive服务器启动meta服务。

这里用mysql的测试服务器,ip位192.168.1.214,新建hive_remote数据库,字符集位latine1

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 
<configuration>

<property>
  <name>hive.metastore.warehouse.dir</name>
  <value>/user/hive/warehouse</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionURL</name>
  <value>jdbc:mysql://192.168.1.214:3306/hive_remote?createDatabaseIfNotExist=true</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionDriverName</name>
  <value>com.mysql.jdbc.Driver</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionUserName</name>
  <value>hive</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionPassword</name>
  <value>password</value>
</property>

<property>
  <name>hive.metastore.local</name>
  <value>false</value>
</property>

<property>
  <name>hive.metastore.uris</name>
  <value>thrift://192.168.1.188:9083</value>
</property>

</configuration>

注:这里把hive的服务端和客户端都放在同一台服务器上了。服务端和客户端可以拆开,将hive-site.xml配置文件拆为如下两部分

         1)、服务端配置文件
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 
<configuration>

<property>
  <name>hive.metastore.warehouse.dir</name>
  <value>/user/hive/warehouse</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionURL</name>
  <value>jdbc:mysql://192.168.1.214:3306/hive_remote?createDatabaseIfNotExist=true</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionDriverName</name>
  <value>com.mysql.jdbc.Driver</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionUserName</name>
  <value>root</value>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionPassword</name>
  <value>test1234</value>
</property>
</configuration>

         2)、客户端配置文件
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 
<configuration>

<property>
  <name>hive.metastore.warehouse.dir</name>
  <value>/user/hive/warehouse</value>
</property>
 
<property>
  <name>hive.metastore.local</name>
  <value>false</value>
</property>

<property>
  <name>hive.metastore.uris</name>
  <value>thrift://192.168.1.188:9083</value>
</property>

</configuration>

启动hive服务端程序

$ hive --service metastore 

客户端直接使用hive命令即可

root@my188:~$ hive 
Hive history file=/tmp/root/hive_job_log_root_201301301416_955801255.txt
hive> show tables;
OK
test_hive
Time taken: 0.736 seconds
hive>








### Hive Metastore 的作用 Hive MetastoreHive 的核心组件之一,主要用于存储和管理 Hive 数据仓库中的元数据信息。元数据包括数据库、表、列、分区、表的存储位置以及数据格式等定义信息。这些元数据在用户执行 HiveQL 查询时被用于解析表结构、确定数据存储路径以及优化查询计划。Hive 在执行查询时,首先会从 Metastore 中获取表的结构信息,以确保查询能够正确执行[^1]。 Hive Metastore 的设计支持多种存储后端,其中最常见的是使用关系型数据库,例如 MySQL 或 PostgreSQL。这种方式能够提供高效的元数据存储和查询能力,并支持并发访问和事务管理。 --- ### 配置 Hive Metastore 使用 MySQL 要将 Hive Metastore 配置为使用 MySQL 作为元数据存储,需要进行以下步骤: 1. **安装 MySQL 数据库** 确保 MySQL 已经安装并正常运行,并且可以远程访问(如果 Hive 服务与 MySQL 不在同一台服务器上)。 2. **配置 Hive Metastore配置文件** 修改 `hive-site.xml` 文件,添加以下配置项: ```xml <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://<mysql-host>:3306/<database-name>?createDatabaseIfNotExist=true</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.cj.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value><mysql-username></value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value><mysql-password></value> </property> ``` 其中,`<mysql-host>` 是 MySQL 数据库的地址,`<database-name>` 是用于存储 Hive 元数据的数据库名称(例如 `db`),`<mysql-username>` 和 `<mysql-password>` 是 MySQL 的登录凭证。如果指定的数据库不存在,MySQL 会自动创建该数据库[^2]。 3. **下载 MySQL JDBC 驱动** 将 MySQL 的 JDBC 驱动(例如 `mysql-connector-java-8.0.x.jar`)放置在 Hive 的 `lib` 目录下,以便 Hive 能够加载该驱动。 4. **初始化 Metastore 数据库** 执行以下命令初始化 Metastore 数据库,创建所需的表结构: ```bash schematool -dbType mysql -initSchema ``` 5. **启动 Hive Metastore 服务** 使用以下命令启动 Hive Metastore 服务: ```bash hive --service metastore ``` 启动后,Hive Metastore 将监听客户端请求,并管理 MySQL 中的元数据[^3]。 --- ### 注意事项 - 在对 Hive Metastore 的 MySQL 数据库进行升级或维护时,应确保关闭 Metastore 服务,以避免元数据的不一致或冲突。例如,在执行 schema 升级期间,必须限制对 MySQL 数据库的访问[^4]。 - 如果多个 Hive 服务实例同时访问同一个 MySQL 数据库,应确保数据库连接配置正确,并避免并发写入导致的冲突。 ---
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值