GBase 8a MPP Cluster 数据加载参数及语句

本文详细介绍了GBase 8a MPP Cluster的数据加载过程,包括LOAD DATA INFILE语句的使用,涉及字符集、数据格式、字段分隔符、空值处理等多个选项,以及日期时间格式的设定,旨在帮助用户高效地进行数据导入。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CHARACTER SET : 用来指定待加载数据文件的编码格式,目前支持GBK和UTF8 两种格式。省略时,认为不需要转码。
DATA_FORMAT:用来指定使用哪种方式解析数据文件并加载。指定为3,表示使用文本方式加载。指定为4,表示使用定长方式加载。如果某列数据可能包含了行分隔符,则需要在SQL中输入'HAVING LINES SEPARATOR'子句。指定为5,表示使用文本文件宽松模式,即数据源文件为包围符中含有换行符和包围符文本文件,或多列少列文本文件。
NULL_VALUE:用于指定空值字符,支持不超过15个任意字符的组合,参数值以引号包围,指定方式与字段包围符一样。
TERMINATED BY:用于指定字段分隔符,支持不超过 15 个任意字符的组合,支持任意字符,参数值以引号包围,仅当使用文本方式加载时有效。可使用字符本身(仅限可见字符,如: "|")、 C 风格转义字符(如: "\a")、 \xhh 十六进制(如: "\xFF")或 x''十六进制(如: "x'09'")四种方式指定。例如: '|',表示用|作为分隔字符。
ENCLOSED BY:用于指定字段包围符,支持任意单字符,参数值以单引号包围,仅当使用文本方式加载时有效。可使用字符本身(仅限可见字符,如:"|")、 C 风格转义字符(如: "\a")、 \xhh 十六进制(如: "\xFF")或 x''十六进制(如:"x'09'")四种方式指定。
PRESERVE [LEADING | TRAILING] BLANKS:用于设定是否保留字段内容两端的空格, 可选参数可以选择保留左边空格或者右边空格, 默认不保留空格。
AUTOFILL:用于设定是否启用缺失列自动补齐功能,启用该参数后,对缺失分割符的字段数据按照 default 值或者 NULL值进行加载,默认不自动补齐。
LENGTH:在使用定长模式加载时,用于设定字段长度的参数。定长格式数据导入时,设置每个字段的长度,有多个字段时,用逗号分隔。
TABLE_FIELDS:用于指定列加载,对于日期时间类型可以设置每一列的格式。 对于数据加载过程中,数据文件中不需要加载的字段,可以使用table_fields 参数中的 filler 关键字将其忽略掉。
SET:指定列值加载,加载系统将待加载文件和指定加载列值加载到集群系
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值