简介:Greenplum流服务器(GPSS)管理客户端(如:Greenplum- Kafka )和Greenplum数据库之间的通信和数据传输。在使用该服务将数据加载到Greenplum数据库之前,必须先配置并启动GPSS实例。
1. 安装前准备条件
Greenplum流服务器gpss和gpsscli命令行工具,在安装Greenplum数据库版本5.16及其以上版本时,已自动安装在其中,无需进行单独安装。
在启动GPSS服务器实例之前,请确保:
- 安装并启动一个兼容GPSS的Greenplum数据库版本,建议安装grenplum 5.16以上版本;
- greenplum master节点配置好主机名,确保可以通过主机名访问;
- 如果您的Greenplum数据库主服务器进程没有在默认端口(5432)上运行,则可识别它所运行的端口。
- 确保GPSS所在主机与客户端、及Greenplum master和所有的segment能够连通;
- 如果您正在使用gpsscli客户端实用程序,确保gpsscli能够连接到客户端主机,例如使用kafka作为数据源,必须确保能够连接到kafka集群,同时gpsscli能够连接到greenplum master和所有segment节点。
2. 注册GPSS扩展
必须在需要利用gpss写入数据的表,所在的数据库注册gpss扩展,这样才能利用gpss向该数据库下的表加载数据。需要注意数据库权限问题,最好是超级用户或该数据库的所有者。
注册gpss扩展步骤如下:
- 配置greenplum环境变量:利用gpadmin超级用户登录到greenplum master节点
gpmaster$ source $GP_HOME/greenplum_path.sh