常见的正则表达式匹配中英文、字母和数字

最新推荐文章于 2025-04-14 14:36:41 发布

置顶

weixin_48005879

最新推荐文章于 2025-04-14 14:36:41 发布

阅读量1.2k

点赞数 1

分类专栏：最全正则表达式文章标签：正则表达式

本文链接：https://blog.youkuaiyun.com/weixin_48005879/article/details/108181294

版权

本文汇总了在项目中常用的正则表达式，用于匹配中文、英文、字母和数字，为你的文本处理提供便利。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在做项目的过程中，使用正则表达式来匹配一段文本中的特定种类字符，是比较常用的一种方式，下面是对常用的正则匹配做了一个归纳整理。

1、匹配中文:[\u4e00-\u9fa5]

2、英文字母:[a-zA-Z]

3、数字:[0-9]

4、匹配中文，英文字母和数字及下划线：^[\u4e00-\u9fa5_a-zA-Z0-9]+$
同时判断输入长度：
[\u4e00-\u9fa5_a-zA-Z0-9_]{
   4,10}

5、
(?!_)　　不能以_开头
(?!.*?_$)　　不能以_结尾
[a-zA-Z0-9_\u4e00-\u9fa5]+　　至少一个汉字、数字、字母、下划线
$　　与字符串结束的地方匹配

6、只含有汉字、数字、字母、下划线，下划线位置不限：
^[a-zA-Z0-9_\u4e00-\u9fa5]+$

7、由数字、26个英文字母或者下划线组成的字符串
^\w+$

8、2~4个汉字
"^[\u4E00-\u9FA5]{2,4}$";

9、最长不得超过7个汉字，或14个字节(数字，字母和下划线)正则表达式
^[\u4e00-\u9fa5]{
   1,7}$|^[\dA-Za-z_]{
   1,14}$
 

10、匹配双字节字符(包括汉字在内)：[^x00-xff]
评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

11、匹配空白行的正则表达式：ns*r
评注：可以用来删除空白行

12、匹配HTML标记的正则表达式：<(S*?)[^>]*>.*?|<.*? />
评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧无能为力

13、匹配首尾空白字符的正则表达式：^s*|s*$
评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式

14、匹配Email地址的正则表达式：^[a-zA-Z0-9][\w\.-]*[a-zA-Z0-9]@[a-zA-Z0-9][\w\.-]*[a-zA-Z0-9]\.[a-zA-Z][a-zA-Z\.]

最低0.47元/天解锁文章