create table temp.tmp_test_serp(
id string,
name string,
password string
)row format delimited fields terminated by '\003'


使用java编写一个特定分割符\u0003的txt文件。
int splitChar = 3;
String splitString1 = String.valueOf((char)splitChar);
System.out.println(splitChar+"的字符串形式表示为"+splitString1);
serpTest.writeFile(userList,filePath,splitString1);
完整版的读取mysql生成特定分隔符的文件
由于hive由java编写,所以row format delimited fields terminated by 后也可以使用java的方式输入特殊字符,
比如用java的转义字符——反斜杠()+0+八进制数字可以代表任意ASCII码,或者用\u + 四位数字可以代表任意Unicode字符。
比如hive创建表格的默认分隔符为SOH字符,ASCII码中的序号为1,所以可以用’\001’表示。
详情可参考Java官方说明:http://docs.oracle.com/javase/specs/jls/se8/html/jls-3.html#jls-OctalNumeral
不过需要注意的时,目前hive似乎只支持一个字符作为分隔符,不支持多个字符作为分隔符,如果row format delimited fields terminated by后面跟多个字符,比如
row format delimited fields terminated by ‘…’
系统只会使用一个点(.)作为分隔符。
该博客介绍了如何使用Java编写代码,生成以特定字符''作为分隔符的TXT文件,以适应Hive的数据导入需求。内容涵盖了Java转义字符和Unicode表示法,以及Hive对分隔符的支持情况。同时,讨论了Hive创建表时的rowformatdelimitedfieldsterminatedby语句如何使用特殊字符。
4432






