1 部署过程
使用Docker镜像部署,以 【官方文档】连接Hive集群为例:
按照文档示例,在 etc/catalog/ 目录下创建 hive.properties 文件,并写入以上配置。
进入容器命令:docker exec -i -t 【容器名称】 /bin/bash
注:其他命令类似 Linux。
2 问题现象
使用Docker命令进入 Trino CLI:
docker exec -it trino trino --catalog hive
执行Trino CLI命令,查询已有 Catalog:
show catalogs;
查询结果只显示自带的几个 Catalog(相当于数据源),没有新增的数据源,就像配置文件没有被加载一样。
3 问题解决
原因:此版本配置文件存放目录与文档中描述不一致,非文档中描述的 etc/catalog/ 目录。
解决:应该存放在 etc/trino/catalog/ 目录下,在此目录下创建 hive.properties 文件,重启容器即可。
再次执行 show catalogs,正常显示新配置的数据源即为成功。
4 注意事项
若大数据集群 HDFS 为高可用配置,需按照文档增加 core-site.xml 和 hdfs-site.xml 配置文件,才可正常查询获取数据。如下图:
参考文档
1、Docker 命令大全 | 菜鸟教程
2、使用的 trinodb/trino - Docker 镜像| Docker Hub