| http://my.oschina.net/sunyh/blog/40554 java编码与txt编码对应 | |
| java | txt |
| unicode | unicode big endian |
| utf-8 | utf-8 |
| utf-16 | unicode |
| gb2312 | ANSI |
java读取txt文件,如果编码格式不匹配,就会出现乱码现象。所以读取txt文件的时候需要设置读取编码。txt文档编码格式都是写在文件头的,在程序中需要先解析文件的编码格式,获得编码格式后,在按此格式读取文件就不会产生乱码了。
InputStream inputStream = new FileInputStream("E:/1.txt");
byte[] head = new byte[3];
inputStream.read(head);
String code ="gb2312";
if (head[0] == -1 && head[1] == -2) {
code = "UTF-16";
}
if (head[0] == -2 && head[1] == -1) {
code = "Unicode";
}
if(head[0]==-17 && head[1]==-69 && head[2] ==-65) {
code = "UTF-8";
}
System.out.println(code);
这样就获得了txt的编码格式了。
本文介绍了如何使用Java代码解析TXT文件的编码格式,避免因编码格式不匹配导致的乱码问题。文中提供了针对UTF-8、UTF-16及GB2312等常见编码的判断方法。
1241

被折叠的 条评论
为什么被折叠?



