Java判断中文符号 — Character.UnicodeBlock中的cjk说明

本文介绍了如何使用Java中的Character.UnicodeBlock判断中文符号,包括CJK统一表意符号、兼容象形文字等,并提到了相关UnicodeBlock的范围。同时,文章提及了Character.isLetter和Character.isDigit方法用于检测字符是否为字母或数字。

01. Java判断中文符号

private static final boolean isChinese(char c) {   
    Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); 
    //获取此字符的UniCodeBlock 
    if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS  
            || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS  
            || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A  
            || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION  
            || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION  
            || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {  
        return true;  
    }  
    return false;  
}  

02. Character.UnicodeBlock中的cjk说明

CJK的意思是“Chinese,Japanese,Korea”的简写 ,实际上就是指中日韩三国的象形文字的Unicode编码 。
jdk API中Character.UnicodeBlock中的cjk说明:
在这里插入图片描述

  • Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS : 4E00-9FBF:CJK 统一表意符号
  • Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS :F900-FAFF:CJK 兼容象形文字
  • Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A :3400-4DBF:CJK 统一表意符号扩展A
  • Character.UnicodeBlock.GENERAL_PUNCTUATION :2000-206F:常用标点
  • Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION :3000-303F:CJK 符号和标点
  • Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS :FF00-FFEF:半角及全角形式

小注:
Character.isLetter( c ):判断字符是否是字母
Character.isDigit( c ):判断字符是否是数字

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值