HIVE
1. 背景描述
Hive是一个数据仓库,用来代替简单的MapReduce代码的一种方案。
可以不必学习java语言实现MapReduce查询数据。
2. 环境
基于Hadoop2 HA + zookeeper集群环境,hive必须基于一个关系型数据库
Node4 192.168.118.145
3. 配置mysql
1. node4中安装mysql后,创建hive数据库
2. 授权一个hosts可以登录mysql的账户
Ø grantall on *.* to root@'node4' identified by 'root'
Ø flush privileges;
4. 配置Hive
1. 解压hive,将mysql-connection.jar复制到hive的lib目录下
2. 复制配置文件cp hive-default.xml.template hive-site.xml
3. 编辑hive-site.xml
a) 配置数据库连接
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://node4:3306/hive</value>
<description>JDBC connect string for aJDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
<description>Driver class name for aJDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
<description>username to use againstmetastore database</description>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>root</value>
<description>password to use againstmetastore database</description>
</property>
4. 启动hive
./bin/hive
5. JDBC连接hive
1. 开启hive服务
a) 修改配置文件hive-site.xml:
<name>hive.server2.thrift.bind.host</name>
<value>hadoop2</value>
<name>hive.localize.resource.wait.interval</name>
<value>5000(L)</value>
a) 启动服务
b) #0.13版本
hive --servic hiveserver2
后台启动服务
hive --servic hiveserver2 &>/dev/null&
#1.0.0
./hiveserver2
后台启动服务
./hiveserver2&>/dev/null &
2. 测试:
找另外一台机器,解压hive
./beeline
!connectjdbc:hive2://192.168.1.246:10000/default
root
连接成功之后可以运行ddl,dml等
./beeline
!connect jdbc:hive2://node1:10000/default
root