JAVA运行MYSQL的LOAD相关问题小结

最新推荐文章于 2025-02-21 19:02:05 发布

原创

最新推荐文章于 2025-02-21 19:02:05 发布 · 2.3k 阅读

1 ·

CC 4.0 BY-SA版权

在使用JAVA通过JDBC执行MYSQL的LOAD命令加载GBK编码的CSV文件时，遇到了乱码和INT列空值报错的问题。解决方法包括：1) 判断并指定文件的字符集为GBK；2) 对于空值，ORACLE导出的CSV用''表示，需要转换为'N'或使用NULLIF函数处理。参考相关代码和网站。

MYSQL的LOAD来加载ORACLE的CSV文件的过程中，碰到了棘手的几个问题。总结一下。

1、乱码

我本机装的MYSQL设置字符集是UTF8，但是从ORACLE导出的CSV文件GBK编码的，别说使用JDBC来运行了，就算在NAVICAT中运行都报错。

解决方法：先去判断是文件的字符集，然后去指定LOAD的CHARSET

2、INT类型的列，数据为空报错:incorrect integer value

原因在于，ORACLE导出的CSV中，空列是""，MYSQL会将其作为空字符处理（''），导致数据转换错误。

解决方法：

(1).导出时进行转换，如果为空，那么导出数据为"\N"，这样MYSQL才会认出它是空值。

(2).NULLIF进行转换，如果当前列的数据为''，那么将其转成空。

相关代码：

修改好后的LOAD脚本：

load data infile "D:/ftpdir/t_ods_khxxb.csv" 
into table t_ods_khxxb 
CHARACTER SET GBK 
COLUMNS terminated by ',' 
OPTIONALLY ENCLOSED BY '"' 
LINES TERMINATED BY '\r\n' 
IGNORE 1 LINES  
(@KHBH,@JGBH,@KHXM,@KHXB,@KHZT,@GJ,@ZJLB,@ZJHM,@ZJKSRQ,@ZJJSRQ,@SRRQ,@LXDZ,@JTDH,@SJ,@SFZDZ,@KHRQ,@ZXRQ,@ZYXX,@QYJGXX,@XL,@JJRBH,@JJGXJLRQ) 
SET KHBH=nullif(@KHBH,''),JGBH=nullif(@JGBH,''),KHXM=nullif(@KHXM,''),KHXB=nullif(@KHXB,''),KHZT=nullif(@KHZT,''),GJ=nullif(@GJ,''),ZJLB=nullif(@ZJLB,''),ZJHM=