字节流转化为字符流输入异常:java.io.IOException: Underlying input stream returned zero bytes

本文介绍了一种从SFTP获取文件并移除UTF-8 BOM的方法,使用了BOMInputStream组件。文章详细说明了如何判断文件是否包含BOM,并通过实例展示了在特定版本的commons-io中遇到的问题及解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题使用场景:

从sftp获取字节流,使用BOMInputStream(commons-io包)去除utf-8 bom头,然后通过BufferedReader输出并存储到数据库;

BOMInputStream 使用:

BOMInputStream bomInputStream = new BOMInputStream(in, false, ByteOrderMark.UTF_8, ByteOrderMark.UTF_16LE, ByteOrderMark.UTF_16BE); 构造器会过滤首部三个字节的bom,另外BOMInputStream中 hasBOM()、getBOM()方法也会过滤bom。

 

原代码

// 从sftp获取流

 in = sftpUtil.getInputStream(path + File.separator + fileName);

                // 去除bom

BOMInputStream bomInputStream = new BOMInputStream(in, false, ByteOrderMark.UTF_8, ByteOrderMark.UTF_16LE, ByteOrderMark.UTF_16BE);

                String charsetName = "UTF-8";
                if (bomInputStream.hasBOM()) {
                    charsetName = bomInputStream.getBOMCharsetName();
                    logger.info("文件格式含有bom:" + charsetName + "," + bomInputStream.getBOM());
                }

                br = new BufferedReader(new InputStreamReader(bomInputStream, charsetName));

while ((line = br.readLine()) != null) { // 此处读取报错
                //  输出

        System.out.println(line);
}

 

解决办法:

经排查,是由于commons-io.jar 2.0版本在读取字节时有丢失或者转化异常问题;

commons-io.jar 2.0版本之后无此问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值