这里有一段程序:
String a = new String("碁");
String b = new String(a.getByte(),"ISO8859_1");
String c = new String(a.getByte(),"gb2312");
System.out.println("b="+b+" c="+c);
String b = new String(b.getByte("ISO8859_1"),"GBK");
String c = new String(a.getByte("gb2312"),"GBK");
System.out.println("b="+b+" c="+c);
虚拟机的内码是GBK:
输出结果是:
b=?? c=??
b=碁 c=??
这就是奇妙之处了。
当a被转化为gb2312时由于在编码表里找不到对应的编码,故而被替代为?的编码,再转回来就是?了
而被转化为ISO8859_1时,之间将编码平移过去虽然不能正常显示,但是保证了正常转化回来。
ISO8859_1是个比较特殊的字符集,它是一个8位的编码,这就让他成为一个非常好的中介机构,会忠实的将每个字节的数据记录下来而不改变,估计这是web传输和jdbc传输使用它为字符集的原因吧。
博客展示了一段String编码转换的程序,分析了不同编码转换的输出结果。当a转化为gb2312时因编码表无对应编码被替代为?,而转化为ISO8859_1可正常转回。ISO8859_1是8位编码,能忠实记录字节数据,这可能是web和jdbc传输用它为字符集的原因。
701

被折叠的 条评论
为什么被折叠?



