字节IO流读取txt文件乱码问题

最新推荐文章于 2024-02-29 10:45:44 发布

苝花向暖丨楠枝向寒

最新推荐文章于 2024-02-29 10:45:44 发布

阅读量2.2k

点赞数

CC 4.0 BY-SA版权

文章标签： IO流乱码问题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_40247263/article/details/79231299

本文分析了导致字节IO流读取txt文件出现乱码的两个主要原因：编码不一致和字节数组大小不合适。解决方式包括确保文件和Java源代码的编码匹配，以及在处理包含中文的文本时使用字符流代替字节流。提供了代码示例进行说明。

原因一：将txt文件的内容转为IO流与 byte[] 转 String 所用的编码不一致（byte[]：用于存读取的数据）。

原因二 : 字节流是以字节单位读取的，假设用一个 byte bytes[] = new byte[11]；去接收文本里面有4个汉字的txt文档的IO流。

此时假设编码格式为UTF-8，UTF-8存储一个汉字需要3个字节。也就是说bytes.length>=3*4 才能一次性接收，但我现在bytes数组开辟的空间是11，也就是说需要接收2次。这时候问题就产生了，一个汉字是3个字节，最后一个字的3个字节被拆成了两部分，当你打印的时候，结果显然会出问题。

原因一解决方式：打开txt文档点另存为，对话框最下面可以看到该txt的编码格式

如我的这个是ANSI（GBK），这个编码格式决定了 txt文本中的内容转 IO 流的编码格式。这个格式必须跟你 .java 文件设置的编码格式一样，否则就会产生乱码。

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。