CHARACTER SET : 用来指定待加载数据文件的编码格式,目前支持GBK和UTF8 两种格式。省略时,认为不需要转码。
DATA_FORMAT:用来指定使用哪种方式解析数据文件并加载。指定为3,表示使用文本方式加载。指定为4,表示使用定长方式加载。如果某列数据可能包含了行分隔符,则需要在SQL中输入'HAVING LINES SEPARATOR'子句。指定为5,表示使用文本文件宽松模式,即数据源文件为包围符中含有换行符和包围符文本文件,或多列少列文本文件。
NULL_VALUE:用于指定空值字符,支持不超过15个任意字符的组合,参数值以引号包围,指定方式与字段包围符一样。
TERMINATED BY:用于指定字段分隔符,支持不超过 15 个任意字符的组合,支持任意字符,参数值以引号包围,仅当使用文本方式加载时有效。可使用字符本身(仅限可见字符,如: "|")、 C 风格转义字符(如: "\a")、 \xhh 十六进制(如: "\xFF")或 x''十六进制(如: "x'09'")四种方式指定。例如: '|',表示用|作为分隔字符。
ENCLOSED BY:用于指定字段包围符,支持任意单字符,参数值以单引号包围,仅当使用文本方式加载时有效。可使用字符本身(仅限可见字符,如:"|")、 C 风格转义字符(如: "\a")、 \xhh 十六进制(如: "\xFF")或 x''十六进制(如:"x'09'")四种方式指定。
PRESERVE [LEADING | TRAILING] BLANKS:用于设定是否保留字段内容两端的空格, 可选参数可以选择保留左边空格或者右边空格, 默认不保留空格。
AUTOFILL:用于设定是否启用缺失列自动补齐功能,启用该参数后,对缺失分割符的字段数据按照 default 值或者 NULL值进行加载,默认不自动补齐。
LENGTH:在使用定长模式加载时,用于设定字段长度的参数。定长格式数据导入时,设置每个字段的长度,有多个字段时,用逗号分隔。
TABLE_FIELDS:用于指定列加载,对于日期时间类型可以设置每一列的格式。 对于数据加载过程中,数据文件中不需要加载的字段,可以使用table_fields 参数中的 filler 关键字将其忽略掉。
SET:指定列值加载,加载系统将待加载文件和指定加载列值加载到集群系
GBase 8a MPP Cluster 数据加载参数及语句
最新推荐文章于 2024-12-16 09:02:40 发布