今日用java下个网页,结果悲剧的发现乱码问题,N久前有过乱码的探究,无果,今实不想再,无法
Pre1:java 内部用UCS2编码 ,我的理解是内存操作及java内部文本是UCS2编码;
Pre2:java向本地写文件存在转码 默认问操作系统默认码(我猜的)
Pre3:最重要的一句话 来至http://www.linuxforum.net/books/UTF-8-Unicode.html
国际标准 ISO 10646 定义了 通用字符集 (Universal Character Set, UCS). UCS 是所有其他字符集标准的一个超集. 它保证与其他字符集是双向兼容的. 就是说, 如果你将任何文本字符串翻译到 UCS格式, 然后再翻译回原编码, 你不会丢失任何信息.
Pre4:网页—》输入流—》内存操作—》输出流—》本地文件
每者之间存在转码
多谢意会

被折叠的 条评论
为什么被折叠?



