本篇文章主要介绍使用gpload进行数据导入操作流程
准备工作:
(1)GP数据库管理节点
(2)数据存储接口机
(3)gpfdist服务启动并开启9091端口
(4)保证数据存储接口机和数据库之前访问正常
一、先创建序列,用来作为记录gpload的审计记录的ID
--创建序列
create SEQUENCE gpload_ccdb_seq INCREMENT BY 1 MINVALUE 1 NO MAXVALUE START WITH 1;
select * from gpload_ccdb_seq ;
--创建审计表,记录每一次gpload执行的开始和结束事件信息
create table gpload_ccdb(
ID bigint,
STATE text,
mode text,
TABLENAME text,
UPDATETIME timestamp
) distributed by (ID);
2. 创建gpload加载数据的表,将数据导入的表
CREATE TABLE load_data(
id text,
name text,
company text,
school text,
date date
);
3. 创建yaml文件
在数据库管理节点master上创建目录/home/gpadmin/gp_ctl,并编写gpload需要的yaml格式的文件my_load.yml,内容如下:
VERSION: 1.0.0.1
DATABASE: ccdb
USER: chkuse