中文正则,Notepad++中文正则

转载请注明出处如果您觉得文章有用,就点个赞吧!

中文在unicode的范围如下:

字符集字数Unicode 编码
基本汉字20902字4E00-9FA5
基本汉字补充74字9FA6-9FEF
扩展A6582字3400-4DB5
扩展B42711字20000-2A6D6
扩展C4149字2A700-2B734
扩展D222字2B740-2B81D
扩展E5762字2B820-2CEA1
扩展F7473字2CEB0-2EBE0
扩展G4939字30000-3134A
康熙部首214字2F00-2FD5
部首扩展115字2E80-2EF3
兼容汉字477字F900-FAD9
兼容扩展542字2F800-2FA1D
PUA(GBK)部件81字E815-E86F
部件扩展452字E400-E5E8
PUA增补207字E600-E6CF
汉字笔画36字31C0-31E3
汉字结构12字2FF0-2FFB
汉语注音43字3105-312F
注音扩展22字31A0-31BA
1字3007

JS中的中文正则

let str = '你好中国';
/[\u4e00-\u9fa5]+/.test(str);
/[一-龥]+/.test(str);

NotePad++中的中文正则

[\x{4e00}-\x{9fa5}]+
#或者
[一-龥]+

PHP中的中文正则

$str = '你好中国';
preg_match("/^[\x{4E00}-\x{9FA5}]+$/u", $str, $match);
preg_match("/^[一-龥]+$/u", $str, $match);

知识扩展

对于上述正则提到的 一-龥 可以生效,可以看下图:
表示的是unicode的中文起始编码,
表示的是unicode的中文结束编码,明白原因了把
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值