本问题已经有最佳答案,请猛点这里访问。
我正在尝试从二进制流中读取数据,其一部分应解析为UTF-8。
直接将InputStream用于二进制数据,并将其顶部的InputStreamReader用于UTF-8文本是行不通的,因为阅读器将提前读取并弄乱后续的二进制数据,即使被告知要读取最大值n个字符。
我知道这个问题与以多种格式从InputStream读取非常相似,但是那里提出的解决方案特定于HTTP流,这对我没有帮助。
我想到只是将所有内容读取为二进制数据,然后将相关部分转换为文本。但是我只有字符数据的长度信息,而不是字节。因此,我需要从流中读取字符的事物来了解编码。
有没有一种方法可以告诉InputStreamReader不要比读取给定字符数所需的内容提前读?还是有一种阅读器既支持二进制数据又支持带有编码的文本,并且可以在这些模式之间即时切换?
您需要先阅读二进制部分。如果您识别出需要UTF-8解码的一部分字节,则需要提取这些字节并将其解码。
DataInputStream dis =
// read a binary type.
int num = dis.readInt();
int len = dis.readUnsignedShort();
// read a UTF-8 portion.
byte[] bytes = new byte[len];
dis.readFully(bytes);
String text = new String(bytes,"UTF-8");
// read some binary
double d = dis.readD