Hive内置存储元数据的数据库为derby。但是使用时会有问题,开启Hive之后会占用元数据库,而derby不与其他客户端共享数据。所以一次只能有一个客户端在使用,如果开了另一个客户端就会连接不上。
另外,启动hive时,会在启动的目录创建metasore_db。
假设我在bin目录启动hive,因为本地配了HIVE_HOME,所以直接输 hive就可以启动。此时bin目录就有metasore_db。

如果我再进入其他目录,如conf,输出hive,能成功启动。但是当输入命令时,会报错如下:

退出后发现多了metastore_db。

此时把bin下面的metastore_db拷贝过来

然后再执行hive,然后查询表和数据都没问题。

tips: 元数据只是存储表的一些基本信息,表的具体内容都存在hdfs。元数据指向hdfs。
只要有元数据,就能取到hdfs的数据。如果我们直接在hdfs增加数据,不是通过hive sql增加,hive这边其实也会取到。

Hive默认使用Derby作为元数据库,但因Derby不支持多客户端共享,导致一次只能一个客户端连接。每次启动Hive,会在当前目录创建metastore_db,切换目录可能引发连接问题。解决办法包括拷贝metastore_db到新目录或配置使用其他支持多客户端的元数据库。元数据仅存储表信息,指向HDFS上的数据,即使直接在HDFS增删数据,Hive也能获取到。
最低0.47元/天 解锁文章
3297

被折叠的 条评论
为什么被折叠?



