Java判断中文乱码

在网页爬取或多系统对接数据传输经常会遇到中文乱码的问题,因此需要判断是否出现中文乱码现象。一个简单的判断方法如下:


       /**

    * 是否乱码

    * @param strName

    * @return

    */

   public static boolean isMessyCode(String strName) { 

      Pattern p = Pattern.compile("\\s*|\t*|\r*|\n*"); 

      Matcher m = p.matcher(strName); 

      String after = m.replaceAll(""); 

      String temp = after.replaceAll("\\p{P}"""); 

      char[] ch = temp.trim().toCharArray(); 

      float chLength = ch.length

      float count = 0; 

      for (int i = 0; i < ch.length; i++) { 

          char c = ch[i]; 

          if (!Character.isLetterOrDigit(c)) { 

             if (!isChinese(c)) { 

                count = count + 1; 

             } 

          } 

      } 

      float result = count / chLength; 

      return result > 0 ? true : false ;

   }

 

   /**

    * 是否为中文

    * @param c

    * @return

    */

   public static boolean isChinese(char c) { 

      Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); 

      if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS 

             || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS 

             || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A 

             || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION 

             || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION 

             || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) { 

          return true

      } 

      return false

   } 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值