安装环境
版本 2.1.0 对应CDH5.3.0
impala是CDH的组件,hadoop其他环境(hdfs、yarn、hive)已经准备的情况下,直接通过yum进行安装,这里提供下载地址impala下载
安装内容:
安装的用户为:root
hdname (hive 元数据节点所在)
impala impala-server impala-state-store impala-catalog impala-shell
其他节点
impala-server impala-shell
权限配置(所有机器都应当进行)
impala 安装过程中会创建名为 impala 的用户和组,不要删除该用户和组。
如果想要 impala 和 YARN 合作,需要把 impala 用户加入 hdfs 组,相关的可以了解的是Llama项目。
impala 在执行 DROP TABLE 操作时,需要把文件移到到 hdfs 的回收站,所以你需要创建一个 hdfs 的目录 /user/impala,并将其设置为impala 用户可写。同样的,impala 需要读取 hive 数据仓库下的数据,故需要把 impala 用户加入 hive 组。
添加附属组命令
usermod -G hive,hdfs,hadoop impala
结果如图
创建impala在hdfs上的目录并设置权限
sudo -u hdfs hadoop fs -mkdir /user/impala
sudo -u hdfs hadoop fs -chown impala /user/impala
设置scoket path
在每个节点上创建/var/run/hadoop-hdfs
kdir -p /var/run/hadoop-hdfs
注意:该文件夹可能已经存在,应当确认用impala是否有权限进行读写
如果已经存在,将用户impala加入该文件所属的组,并修改该文件组的权限即:chmod 775 /var/run/hadoop-hdfs
mysql驱动
驱动下载地址mysql-connector-java-5.1.30.tar.gz
将下载的文件复制到/usr/share/java/
并修改名为mysql-connector-java.jar
选择这个文件路径是因为impala的默认路径是这个,可以查看/etc/default/impala中的参数MYSQL_CONNECTOR_JAR
#配置文件设置
配置文件存在两个地方
#