java判断是否是中文字符

本文详细介绍了如何使用Java代码判断输入字符串中的中文字符,并将其转换为符合AS400存储规范的字符数组。通过分析Unicode块,实现中文字符的识别与特殊处理,确保转换后的字符串满足AS400的存储需求。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

public class StringUtil {
 
 /**
  * 判断是否为中文字符
  * @param c
  * @return
  */
 private static boolean isChinese(char c) {
  // GENERAL_PUNCTUATION 判断中文的“号
  // CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号
  // HALFWIDTH_AND_FULLWIDTH_FORMS 判断中文的,号
  Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
  if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
    || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
    || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
    || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
    || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
    || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
   return true;
  }
  return false;
 }
 
 /**
  * 转换成AS400字符数组
  * @param srcStr
  * @param len
  * @return
  */
 private static  char[] getAS400Char(String srcStr,int len) {
  char[] charArray = srcStr.toCharArray();
  int dbLength = 0 ;
  boolean start = false ;  // 中文开始
  boolean end = false ;  // 中文结束
  boolean duration = false ;  // 中文持续
  int charLength = 0 ;
  for (int i = 0; i < charArray.length; i++) {
   // 判断是否是中文字符
   if (isChinese(charArray[i])) {
    if(duration)
     start = false ;
    else
     start = true ;
    duration = true ;
    end = false ;
    dbLength ++ ;  // 中文字符本身就应当比普通字符多一位
   }
   else if(duration){  // 遇到非中文字符时,如果已经开始中文,那么结束
    end = true ;
   }
   dbLength ++ ;  // 无论如何占一位长度
   //如果中文开始,那么加一位
   if(start){
    dbLength ++ ;
    start = false ;
   }
   // 如果中文结束,加一位
   if(duration && end){
    dbLength ++ ;
    duration = false ;
   }
   // 如果数据库长度超过限制,那么退出
   if(dbLength > len)
    break ;
   else if(duration){ // 如果是中文字符中,因为下次无论如何一定会增加一位长度,如果此长度超过,那么退出
    if((dbLength +1) > len)
     break ;
   }
   charLength ++ ;
  }
  char[] targetArr = new char[charLength] ;
  for(int i = 0 ; i < charLength ; i ++){
   targetArr[i] = charArray[i] ;
  }
  return targetArr ;
 }
 
 /**
  * 获取指定长度的符合AS400存储规范的字符串
  * @param srcStr
  * @param len
  * @return
  */
 public static String getAS400Str(String srcStr,int len){
  if(srcStr == null)
   return null ;
  
  return String.valueOf(getAS400Char(srcStr, len)) ;

 }
 
}

### Java 检查字符串是否包含中文字符和标点符号 为了实现这一功能,可以通过遍历字符串中的每一个字符并利用正则表达式来进行判断。 对于检测字符串中是否存在中文字符,可以采用如下方式: ```java public class ChineseCharacterDetection { public static boolean containsChinese(String str) { if (str == null || str.isEmpty()) { return false; } for (char c : str.toCharArray()) { if ('\u4e00' <= c && c <= '\u9fff') { // 判断是否为汉字范围内的字符 return true; } } return false; } } ``` 上述代码通过检查给定字符是否位于Unicode编码表上的中文区间内来决定该字符是不是中文[^1]。 至于识别字符串里是否有中英文标点符号,则可借助于`replaceAll()`函数配合特定模式的正则表达式完成。下面给出了一种解决方案: ```java import java.util.regex.*; public class PunctuationCheck { private static final String CHINESE_PUNCTUATION = "[\\p{P}\\p{S}&&[^a-zA-Z0-9]]"; // 定义用于匹配除字母数字外其他符号(包括但不限于标点) public static boolean hasPunctuations(String input){ Pattern pattern = Pattern.compile(CHINESE_PUNCTUATION); Matcher matcher = pattern.matcher(input); while(matcher.find()){ char ch = input.charAt(matcher.start()); int type = Character.getType(ch); if(type==Character.CONNECTOR_PUNCTUATION || type==Character.DASH_PUNCTUATION || type==Character.END_PUNCTUATION || type==Character.FINAL_QUOTE_PUNCTUATION|| type==Character.INITIAL_QUOTE_PUNCTUATION|| type==Character.OTHER_PUNCTUATION || type==Character.START_PUNCTUATION ) return true; } return false; } } ``` 此段程序定义了一个常量`CHINESE_PUNCTUATION`用来表示可能存在的各种类型的标点符号,并创建了相应的Pattern对象去寻找这些符号的存在与否。如果找到任何符合条件的结果即返回true表明存在这样的标点符号[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值