Java读取文件中含有中文的解决办法

本文详细介绍了在使用Eclipse开发时,遇到导出的jar包中文乱码的问题,并提供了通过指定数据流编码方式解决该问题的方法。同时分享了一个将中文转换为UTF-8编码的实用函数,帮助开发者轻松处理文件编码问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转载自:http://huihua.iteye.com/blog/354189

在Eclipse中运行时一直都很正常,但是一旦导出成jar包时就出现错误,不能正确读取中文,试了很多办法都没有用。 什么new String(str.getBytes(), "UTF-8"); 和System.setProperty("file.encoding","UTF-8")都不顶用。 

最后发现只要在读取文件内容的时候,把InputStreamReader写成下面这样即可。 
Java代码   收藏代码
  1. InputStreamReader  read = new InputStreamReader(new FileInputStream(f),"UTF-8");  
  2.   
  3. BufferedReader reader=new BufferedReader(read);  
  4. String line = null;  
  5. while ((line = reader.readLine()) != null) {  
  6.      System.out.println(line);  
  7. }  


通过打开文件是指定文件编码的方法把这个问题轻松的解决了。 

最后总结一下:java要读取数据流的时候一定要指定数据流的编码方式(至少读取String流的时候要这么作。 

输出文件内容时,转换一下成UTF-8编码,转换方式为: 

Java代码   收藏代码
  1. /** 
  2.  * 中文转unicode 
  3.  *  
  4.  * @param str 
  5.  * @return 反回unicode编码 
  6.  */  
  7. public static String chineseToUnicode(String str)  
  8. {  
  9.     String result = "";  
  10.     for (int i = 0; i < str.length(); i++)  
  11.     {  
  12.         int chr1 = (char)str.charAt(i);  
  13.         if(chr1 > 0 && chr1 < 11 * 15)  
  14.         {  
  15.             result += str.charAt(i);  
  16.         }  
  17.         else if (chr1 <= 0 || chr1 >= 16 * 16 * 16)  
  18.         {  
  19.             result += "\\u" + Integer.toHexString(chr1);  
  20.         }  
  21.         else if (chr1 < 16 * 16 * 16 && chr1 >= 16 * 16)  
  22.         {  
  23.             result += "\\u0" + Integer.toHexString(chr1);  
  24.         }  
  25.         else if (chr1 < 16 * 16 && chr1 >= 11 * 15)  
  26.         {  
  27.             result += "\\u00" + Integer.toHexString(chr1);  
  28.         }  
  29.     }  
  30.     return result;  
  31. }  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值