关于使用InputStreamReader读取GBK编码文件乱码的问题

最新推荐文章于 2024-05-10 11:07:12 发布

最新推荐文章于 2024-05-10 11:07:12 发布 · 1.4k 阅读

文章标签：

#Java #Android

Android 专栏收录该内容

32 篇文章

订阅专栏

本文探讨了在Android环境中读取GBK编码文件时出现乱码的问题。通过对比不同编码方式下的字节转换过程，揭示了直接对已乱码的字符串进行转码无法解决问题的原因，并给出了正确的解决方案。

BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(packageFilePath)));

当使用此Reader读取GBK编码的文件时，所有的中文都会乱码，因为Reader会将读取到的byte转换成char，如果没有指定转换编码，那么Android默认是使用的utf8，那么读取到的内容就会错误。

那么假如读取完毕后进行一次转码是否可以解决乱码问题呢？
比如：

String s = readline();
s = new String(s.getBytes("gbk"), "gbk");

思路是获得字符串的gbk编码，按照gbk编码重新解析一遍，实验证明是不可以的，是什么原因呢？

举例说明：

byte ge[] = {(byte)0xb8, (byte)0xf6};

这是汉字‘个’的gbk编码。
String s = new String(ge, "gbk");
此时s不会是乱码。

s.getBytes("utf8") //得到-28，-72，-86。‘个’的utf8编码
s.getBytes("gbk") //得到0xb8,0xf6。‘个’的gbk编码

而如果用一下代码生成s：

String s = new String(ge, "utf8");

此时s已经是乱码。

s.getBytes("utf8") //得到-17,-65,-67,-17,-65,-67

此时s的内容已经完全乱掉了，所以再用

s.getBytes("gbk");

得到的数据也是乱的，无法逆向出真正的内容来。

所以要解决这个问题只能是让reader将byte转向char时使用正确的编码，即生成Reader时指定编码，即：

BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(packageFilePath), "gbk"));

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mypyg

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Java——IO流（二）-（4/7）：不同编码读取乱码的问题，转换流-InputStreamReader、OutputStreamWriter

li13437542099的博客

07-06

1096

不同编码读取出现乱码的问题如果代码编码和被读取的文本文件的编码是一致的，使用字符流读取文本文件时不会出现乱码如果代码编码和被读取的文本文件的编码是不一致的，使用字符流读取文本文件时就会出现乱码

Java 解决读写本地文件中文乱码的问题

08-31

为了解决Java读写本地文件时的中文乱码问题，我们需要明确两个关键步骤：一是确定文件的原始编码，二是指定Java程序在读写文件时使用的编码。以下是一个简单的示例，展示了如何使用GBK编码读取和写入文件： 1. **...

参与评论您还未登录，请先登录后发表或查看评论

java 执行dos命令并回显

d46023097的专栏

10-30

4125

package main;import java.io.BufferedReader;import java.io.InputStream;import java.io.InputStreamReader;public class Dos { /** * @param args */ public static void main(String[] args) { try { String cmd = "cmd /c ping baidu.com"; Runtime rt = Runtime.

Java 使用InputStream 读取GBK编码文件和其中的换行符,

Dexter

02-28

486

读取整个文件,包括了换行符, 避免了。

指定编码“gbk“，防止中文字符乱码

qq_58341172的博客

10-27

554

InputStreamReader的底层源码如下，可以传递参数charsetName，防止中文乱码。

inputstream流乱码_Java FileInputStream读中文乱码问题解决方案

weixin_39717367的博客

02-23

6768

1、前提以读取编码是GBK的文件为案例，文件内容只有中文和中文符号2、原因FileInputStream读中文乱码是因为一个中文对应两个字节存储(负数)，也就是说，读取对应中文的字节数应该是偶数；而英文对应一个字节存储。FileInputStream每次读取一个数组长度的字节时，读取的中文字节数可能是奇数，也就是只读到中文的一半字节，出现乱码。3、解决方法一次读取所有字节，此方法不靠谱，因为不确...

InputStreamReader介绍&使用

weixin_44664432的博客

09-16

2万+

InputStreamReader类： java.io.InputStreamReader extends Reader InputStreamReader:是字节流通向字符流的桥梁：他使用指定的charset读取字节并将其解码为字符。(解码：把看不懂的变为能看懂的) 继承自父类的共性成员方法： int read() 读取单个字符并返回 int read(char[] cbuf) 一次读取多个字符，经字符读入数组中 void close() 关闭该流并释放与之关联的所有资源构造方

Java读取、写入文件如何解决乱码问题

09-03

2. **使用正确编码读取文件**：一旦识别出文件编码，就可以使用`InputStreamReader`和`BufferedReader`，指定正确的编码来读取文件内容。 ```java String encoding = getFileEncode(filePath); BufferedReader ...

java读写csv文件，中文乱码问题

04-05

可以使用工具，如Notepad++，来检查和更改文件编码。 4. **处理BOM头**：UTF-8有带BOM和不带BOM两种形式，如果文件开头带有BOM标记，可能需要在读取时进行特殊处理，因为某些库可能不支持带BOM的UTF-8。 5. **使用...

练习1：指定编码读取文件读取 poem_gbk.txt(GBK编码）使用 InputStreamReader 指定"GBK" ·打印正确内容用Java写

最新发布

10-16

使用 Java 中的 `InputStreamReader` 指定 GBK 编码读取文件 `poem_gbk.txt`，并正确打印文件内容。 ### 给出答案（带注释的代码） ```java import java.io.*; public class ReadGBKFile { public static void ...

android点滴9:关于输入输出流中文乱码的问题

weixin_34362991的博客

09-29

168

2019独角兽企业重金招聘Python工程师标准>>> ...

Java练习>转换流>>将GBK编码的文本文件，转换为UTF-8编码的文本文件

越努力，越幸福！

08-13

4977

练习：转换文件编码。题目：将GBK编码的文本文件，转换为UTF-8编码的文本文件。分析：1.创建InputStreamReader对象，构造方法中传递字节输入流和指定的编码表名称GBK。2.创建OutputTreamWrite对象，构造方法中传递字节输出流和指定的编码表名称UTF-8。 3.使用InputStreamReader对象中的方法read读取文件。 4.使用OutputTreamWrite对象中的方法write，把读取的数据写入到文件中。5.释放资源。案例如下：

Java_转换流字符编码和字符集 InputStreamReader类 OutputStreamWriter类

劉某人゜的博客

08-31

2453

一.字符编码和字符集 1.字符编码计算机中储存的信息都是用二进制数表示的，而我们在屏幕上看到的数字、英文、标点符号、汉字等字符是二进制数转换之后的结果。按照某种规则，将字符存储到计算机中，称为编码。反之，将存储在计算机中的二进制数按照某种规则解析显示出来，称为解码。比如说，按照A规则存储，同样按照A规则解析，那么就能显示正确的文本f符号。反之，按照A规则存储，再按照B规则解析，就会导致乱码现...

InputStreamReader 和 OutputStreamReader流

weixin_43808717的博客

03-24

762

1. 简介 1. 常见的编码格式 ASCII码：由一个字节表示，只支持一些基础字符和数字以及一些键盘上的符号… UTF8: 万国码，支持所有国家的语言文字。针对Unicode码表的可变长字符编码，一般采用2个左右的字节表示一个字符。 GB2312: 是一种常见的简体中文编码，采用1个或2个字节表示一个字符。 GBK: 简体中文，对GB2312的扩充。 2. 字符流的父类(抽象类) Reader字符输入流类，Writer字符输出流类。 ...

InputStreamReader解决读取文本中文乱码的分析

ZCX5127168的博客

05-25

5428

我所创建的a.txt文本采用的编码格式是ANSI，首先FileInputStream从a.txt文件读取，并且一个字节一个字节传给InputStreamReader，当返回三个字节时(UTF-8是三个字节为1个汉字)，FileInputStream就去UTF-8表中找所对应的中文汉字。结果显而易见，所以出现乱码.所以要将“UTF-8"设置为"GBK”...

通过inputStream 读取数据中文乱码

这天有点热的博客

05-28

1万+

inputStream本身没有包含转码的方式，找了半天。看源码 /* * Copyright (c) 1994, 2013, Oracle and/or its affiliates. All rights reserved. * ORACLE PROPRIETARY/CONFIDENTIAL. Use is subject to license terms. * * * * * * * * * * * * * * * * * * * * */ packa

C#如何读取GBK编码的文件

weixin_44923481的博客

05-10

775

最近在读取一个GBK18030编码的文本文件时，遇到了一些问题，下面简单介绍一下问题以及解决办法。具体解决办法是，添加新的命名空间System.Text.Encoding，进行编码注册。但是程序run后，一直在寻找GBK编码的文件，卡在这一步没法进行下一步。解决办法：在读取文件的时候添加字符编码方式，问题：如何读取GBK编码的文本文件？C#如何读取GBK编码的文件。

inputstream流乱码_InputStreamReader字节流的中文编码处理

weixin_39574555的博客

12-19

1432

背景：最近写一个小功能，Java Project 的编码是UTF-8,打印出来的windows cmd 命令输出所有中文都是乱码。----execCmd: cmd /c ant'ant' ��ڲ��ⲿ��Ҳ��ǿ��еĳ��ļ��分析和查找了一堆资料后，找到问题出在InputStreamReader和BufferedReader两个方法使用上。1)Buf...

InputStream按指定编码读取解决乱码问题