常用正则表达式公式总结

一、校验数字的表达式

  1. 数字:

^[0-9]*$
  1. n位的数字:

^d{n}$
  1. 至少n位的数字:

^d{n,}$
  1. m-n位的数字:

^d{m,n}$
  1. 零和非零开头的数字:

^(0|[1-9][0-9]*)$
  1. 非零开头的最多带两位小数的数字:

^([1-9][0-9]*)+(.[0-9]{1,2})?$
  1. 带1-2位小数的正数或负数:

^(-)?d+(.d{1,2})$
  1. 正数、负数、和小数:

^(-|+)?d+(.d+)?$
  1. 有两位小数的正实数:

^[0-9]+(.[0-9]{2})?$
  1. 有1~3位小数的正实数:

^[0-9]+(.[0-9]{1,3})?$
  1. 非零的正整数:

^[1-9]d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^+?[1-9][0-9]*$
  1. 非零的负整数:

^-[1-9][]0-9"*$ 或 ^-[1-9]d*$
  1. 非负整数:

^d+$ 或 ^[1-9]d*|0$
  1. 非正整数:

^-[1-9]d*|0$ 或 ^((-d+)|(0+))$
  1. 非负浮点数:

^d+(.d+)?$ 或 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$
  1. 非正浮点数:

^((-d+(.d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$
  1. 正浮点数:

^[1-9]d*.d*|0.d*[1-9]d*$ 或 ^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$
  1. 负浮点数:

^-([1-9]d*.d*|0.d*[1-9]d*)$ 或 ^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$
  1. 浮点数:

^(-?d+)(.d+)?$ 或 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$

二、校验字符的表达式

  1. 汉字:

^[一-龥]{0,}$
  1. 英文和数字:

^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
  1. 长度为3-20的所有字符:

^.{3,20}$
  1. 由26个英文字母组成的字符串:

^[A-Za-z]+$
  1. 由26个大写英文字母组成的字符串:

^[A-Z]+$
  1. 由26个小写英文字母组成的字符串:

^[a-z]+$
  1. 由数字和26个英文字母组成的字符串:

^[A-Za-z0-9]+$
  1. 由数字、26个英文字母或者下划线组成的字符串:

^w+$ 或 ^w{3,20}$
  1. 中文、英文、数字包括下划线:

^[一-龥A-Za-z0-9_]+$
  1. 中文、英文、数字但不包括下划线等符号:

^[一-龥A-Za-z0-9]+$ 或 ^[一-龥A-Za-z0-9]{2,20}$
  1. 禁止输入含有~的字符:

[^~"]+

三、特殊需求表达式

  1. Email地址:

^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$
  1. 域名:

[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
  1. InternetURL:

[a-zA-z]+://[^s]* 或 ^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$
  1. 手机号码:

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])d{8}$
  1. 国内电话号码(0511-4405222、021-87888822):

d{3}-d{8}|d{4}-d{7}
  1. 电话号码正则表达式(支持手机号码,3-4位区号,7-8位直播号码,1-4位分机号):

 ((d{11})|^((d{7,8})|(d{4}|d{3})-(d{7,8})|(d{4}|d{3})-(d{7,8})-(d{4}|d{3}|d{2}|d{1})|(d{7,8})-(d{4}|d{3}|d{2}|d{1}))$)
  1. 身份证号(15位、18位数字),最后一位是校验位,可能为数字或字符X:

(^d{15}$)|(^d{18}$)|(^d{17}(d|X|x)$)
  1. 帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):

^[a-zA-Z][a-zA-Z0-9_]{4,15}$
  1. 密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):

^[a-zA-Z]w{5,17}$
  1. 强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在 8-10 之间):

^(?=.*d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
  1. 强密码(必须包含大小写字母和数字的组合,可以使用特殊字符,长度在8-10之间):

^(?=.*d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
  1. 日期格式:

^d{4}-d{1,2}-d{1,2}
  1. 一年的12个月(01~09和1~12):

^(0?[1-9]|1[0-2])$
  1. 一个月的31天(01~09和1~31):

^((0?[1-9])|((1|2)[0-9])|30|31)$
  1. xml文件:

^([a-zA-Z]+-?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$
  1. 中文字符的正则表达式:

[一-龥]
  1. 空白行的正则表达式:

s*
 (可以用来删除空白行)
  1. HTML标记的正则表达式:

<(S*?)[^>]*>.*?|<.*? /> ( 首尾空白字符的正则表达式:^s*|s*$或(^s*)|(s*$) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
  1. 腾讯QQ号:

[1-9][0-9]{4,} (腾讯QQ号从10000开始)
  1. 中国邮政编码:

[1-9]d{5}(?!d) (中国邮政编码为6位数字)
  1. IP地址:

((?:(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))
<think>首先,用户的问题是:“我想查找项目中常用正则表达式匹配示例或规则 请问项目中常用正则表达式匹配示例”。这意味着用户想要知道在项目中常见的正则表达式匹配示例或规则。 我收到了系统级指令,必须遵守: - 所有行内数学表达式使用 `$...$` 格式。 - 独立公式使用 `$$...$$` 格式并单独成段。 - LaTeX语法正确。 - 使用中文回答。 - 生成相关问题。 - 回答中引用的段落末尾自然地添加引用标识。 此外,用户提到了参考站内引用,包括引用[1]、[2]、[3]、[4]和[5]。这些引用提供了有关正则表达式的信息: - 引用[1]:讨论数字匹配的正则表达式,如 `\d`、`\d+` 等。 - 引用[2]:提到匹配汉字的正则表达式- 引用[3]:关于Java中使用正则表达式- 引用[4]:讨论JavaScript中正则匹配失败的原因。 - 引用[5]:关于常用正则表达式集合。 用户说:“上述引用仅供参考,并不是用户真正的需求,请尽可能多的参考用户上一次的问题和你的回答。” 但查看对话历史,上一次消息是系统指令和用户的问题。在对话历史中,用户的第一条消息就是这个请求。所以,我需要基于当前问题和提供的引用来响应。 用户真正的需求是查找项目中常用正则表达式匹配示例或规则。因此,我的回答应该聚焦在提供常见的正则表达式示例,这些示例在项目开发中常用。 结构化回答: - **开头**:简要介绍正则表达式在项目中的应用,并根据引用内容自然地引用。 - **主体**:列出常见的正则表达式匹配示例,比如匹配数字、电子邮件、电话号码、URL、汉字等。确保使用中文解释。 - 由于有引用,我应该在相关部分添加引用标识。 - **结尾**:生成相关问题,以满足指令要求。 - **格式**:行内数学表达式如正则表达式模式应该用 `$...$` 格式,但正则表达式通常不是数学表达式,而是字符串模式。指令说“所有行内数学表达式(包括变量、不等式、方程等)必须使用$...$格式”,但正则表达式不是数学表达式;它更像代码。在示例中,系统指令使用了代码块(如Python代码),但没有提到正则表达式。为了安全起见,我应该将正则表达式模式作为代码或文本处理。指令指定数学表达式用 `$...$`,但正则表达式不是数学;它可能被视为文本模式。在用户提供的引用中,例如引用[1],使用了类似 `\d` 的格式,但没有LaTeX标记。我应该遵循指令:如果是数学表达式,用 `$...$`;但对于正则表达式,它可能更适合直接写或使用代码块。系统指令示例中没有正则表达式,但用户引用中使用了普通文本。我会假设正则表达式模式作为行内代码处理,但指令说“行内数学表达式”,而正则表达式不是数学。为避免混淆,我会在必要时使用 `$...$` 或直接写。在引用[1]中,它写为 `\d` 而没有特殊格式,但在LaTeX中,数学模式可能用于显示特殊字符。为了准确,我会将正则表达式模式写成行内代码或使用 `$...$` 如果它在数学上下文中。但在这里,最好使用反引号表示代码,如系统示例中的Python代码块。在系统指令示例中,代码块用于Python,所以我可以为代码使用代码块。 - 指令说:“独立公式必须使用$$...$$格式并单独成段”,但正则表达式通常不是公式。我会将正则表达式作为文本处理,必要时使用代码块。 - 确保回答使用中文。 常见正则表达式匹配示例: 1. **匹配数字**:如引用[1]提到的,`\d` 匹配单个数字,`\d+` 匹配一个或多个数字。 2. **匹配电子邮件地址**:常见如 `[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}`。 3. **匹配电话号码**:例如,`\(\d{3}\) \d{3}-\d{4}` 用于匹配格式如 (123) 456-7890。 4. **匹配URL**:如 `https?://[^\s/$.?#].[^\s]*`。 5. **匹配汉字**:如引用[2]提到的,Unicode范围用于汉字。 6. **其他常见**:如日期格式、IP地址等。 从引用中: - 引用[1]:专注于数字匹配。 - 引用[2]:汉字匹配。 - 引用[3]:Java中使用。 - 引用[4]:JavaScript中问题。 - 引用[5]:常用集合。 我会整合这些,并提供示例。 生成相关问题:在结尾添加相关问题,如指令示例那样。 回答结构: 1. 介绍:正则表达式在项目中的重要性。 2. 常见匹配示例列表:每个示例说明模式、用途,并添加引用标识如果需要。 3. 结论:总结。 4. 相关问题。 添加引用标识:基于用户提供的引用,但用户说“仅供参考”,所以我应该在相关内容处自然地添加。 例如: - 当讨论数字匹配时,添加 [^1]。 - 当讨论汉字匹配时,添加 [^2]。 - 等等。 最终,相关问题:生成3-5个相关问题。 </think>### 项目中常用正则表达式匹配示例 正则表达式是一种强大的工具,用于在各种项目中高效处理字符串匹配、验证和文本操作(如数据提取、输入验证等)。根据您提供的参考资料,我整理了一些项目中常见的正则表达式匹配示例和规则。这些示例涵盖了数字、电子邮件、日期、汉字等常见场景,并结合实际项目需求进行说明。每个示例都使用了标准正则表达式语法,并确保兼容主流编程语言(如 JavaScript、Python、Java 等)。如果您在实现时遇到问题,可以参考相关引用或调试工具(如在线正则测试器)。 以下是常见正则表达式匹配示例及其用途解释(模式使用 `$...$` 格式表示行内表达式,独立公式单独成段): #### 1. **匹配数字序列(如 ID、金额)** - **模式**:`$\d+$` 或 `$\d{n}$` - **用途**:在数据清洗或表单验证中,匹配连续数字(如订单号、金额)。例如: - `$\d+$` 匹配一个或多个数字(如 "123")。 - `$\d{6}$` 匹配恰好 6 位数字(如邮政编码)。这在引用[1]中强调了数字匹配的基本规则:`\d` 用于单个数字,`\d+` 用于多个数字[^1]。 - **应用场景**:用户输入验证(如手机号)、日志文件中提取数字 ID。 - **代码示例**(JavaScript): ```javascript const regex = /\d+/; console.log(regex.test("订单号: 1001")); // 输出: true,匹配到 "1001" ``` #### 2. **匹配电子邮件地址** - **模式**:`$[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$` - **用途**:用于注册表单或数据导入时验证邮箱格式。该模式确保用户名部分(如 "user.name")包含字母、数字、点或破折号,域名部分(如 "domain.com")以至少两个字母结尾。 - **应用场景**:用户注册系统、电子邮件营销工具。引用[4]指出,正则匹配失败的原因包括忘记设置全局标志或特殊字符处理不当,测试时需添加标志如 `g` 或 `i`[^4]。 - **代码示例**(Python): ```python import re pattern = r&#39;[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}&#39; result = re.findall(pattern, "联系 support@example.com 获取帮助") print(result) # 输出: [&#39;support@example.com&#39;] ``` #### 3. **匹配汉字(中文字符)** - **模式**:`$[\u4e00-\u9fa5]+$` - **用途**:在文本处理中提取或验证中文字符(如用户昵称、评论筛选)。该模式基于 Unicode 范围(4E009FA5),匹配一个或多个汉字。 - **应用场景**:多语言网站、中文内容分析。引用[2]详细说明了汉字匹配的正则表达式,适用于汉字字符的提取[^2]。 - **代码示例**(Java): ```java import java.util.regex.*; Pattern pattern = Pattern.compile("[\u4e00-\u9fa5]+"); Matcher matcher = pattern.matcher("Hello 世界!"); while (matcher.find()) { System.out.println(matcher.group()); // 输出: "世界" } ``` #### 4. **匹配日期格式(如 YYYY-MM-DD)** - **模式**:`$\d{4}-\d{2}-\d{2}$` - **用途**:在数据导入或日志解析中,验证标准日期格式。匹配类似 "2023-10-05" 的字符串。 - **应用场景**:数据库输入校验、报告生成。引用[5]中提到,正则表达式简化了模式匹配,比传统代码更高效[^5]。 - **代码示例**(任何语言通用): - 测试字符串:`2023-10-05`. - 匹配结果:整个字符串被匹配。 #### 5. **匹配 URL 链接** - **模式**:`$https?://[^\s/$.?#]+\.[^\s]*$` - **用途**:在网页爬虫或内容管理系统中,提取或验证 HTTP/HTTPS URL。匹配以 "http://" 或 "https://" 开头的基本链接。 - **应用场景**:网络爬虫、用户输入过滤。引用[4]分析了 URL 匹配失败的原因,如忽略全局标志或贪婪匹配问题,建议使用非贪婪限定符如 `?`[^4]。 - **代码示例**(Python): ```python import re url_pattern = r&#39;https?://[^\s/$.?#]+\.[^\s]*&#39; text = "访问 https://example.com/page" print(re.search(url_pattern, text).group()) # 输出: https://example.com/page ``` #### 6. **匹配电话号码(国际格式)** - **模式**:`$\+?\d{1,3}[-.\s]?\d{3,4}[-.\s]?\d{4}$` - **用途**:验证用户输入的手机或座机号,支持格式如 "+86 13812345678" 或 "020-12345678"。 - **应用场景**:CRM 系统、联系人表单。引用[1]的规则(如 `\d{n}`)可用于定制不同长度的号码[^1]。 - **代码示例**(JavaScript): ```javascript const phoneRegex = /\+?\d{1,3}[-.\s]?\d{3,4}[-.\s]?\d{4}/; console.log(phoneRegex.test("电话: +1 800-555-1234")); // 输出: true ``` #### 总结 正则表达式在项目开发中至关重要,能显著提升文本处理效率。以上示例覆盖了常见场景,但实际使用时需根据语言特性调整(如 JavaScript 中的 `RegExp` 对象或 Python 的 `re` 模块)。引用[3]强调,掌握基本语法和调试技巧(如使用 `Pattern` 和 `Matcher` 类)可以避免常见错误[^3]。如果您有特定需求或语言环境,可以通过在线工具(如 regex101.com)测试和优化模式。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值