现象:
用Java程序读写含中文的txt文件时,读出或写入的内容出现乱码。
原因:
出现乱码的原因是操作系统和Java程序使用的编码格式不同。中文Windows OS默认使用的是GBK编码,而Eclipse IDE的Encode默认使用的是UTF-8编码。在OS下手动创建并写入的txt文件使用的是GBK编码,用Java程序直接去读时用的是UTF-8编码,所以会出现乱码。为了避免可能的中文乱码问题,最好在读写文件的时候显式指定编码格式。
解决方法:
在读写文件的时候显式指定编码格式。
获取读文件的字符流:
InputStreamReader isr = new InputStreamReader(new FileInputStream(file),"UTF-8");
BufferedReader br = new BufferedReader(isr);
获取写文件的字符流:
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(file),"UTF-8");
BufferedWriter bw = new BufferedWriter(osw);