常用正则表达式公式总结

一、校验数字的表达式

数字:

^[0-9]\*$

n位的数字:

^\d{n}$

至少n位的数字:^\d{n,}$
m-n位的数字:^\d{m,n}$
零和非零开头的数字:^(0|[1-9][0-9]\*)$
非零开头的最多带两位小数的数字:^([1-9][0-9]\*)+(\.[0-9]{1,2})?$
带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})$
正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$
有两位小数的正实数:^[0-9]+(\.[0-9]{2})?$
有1~3位小数的正实数:^[0-9]+(\.[0-9]{1,3})?$
非零的正整数:^[1-9]\d\*$ 或 ^([1-9][0-9]\*){1,3}$ 或 ^\+?[1-9][0-9]\*$
非零的负整数:^\-[1-9][]0-9"\*$ 或 ^-[1-9]\d\*$
非负整数:^\d+$ 或 ^[1-9]\d\*|0$
非正整数:^-[1-9]\d\*|0$ 或 ^((-\d+)|(0+))$
非负浮点数:^\d+(\.\d+)?$ 或 ^[1-9]\d\*\.\d\*|0\.\d\*[1-9]\d\*|0?\.0+|0$
非正浮点数:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d\*\.\d\*|0\.\d\*[1-9]\d\*))|0?\.0+|0$
正浮点数:^[1-9]\d\*\.\d\*|0\.\d\*[1-9]\d\*$ 或 ^(([0-9]+\.[0-9]\*[1-9][0-9]\*)|([0-9]\*[1-9][0-9]\*\.[0-9]+)|([0-9]\*[1-9][0-9]\*))$
负浮点数:^-([1-9]\d\*\.\d\*|0\.\d\*[1-9]\d\*)$ 或 ^(-(([0-9]+\.[0-9]\*[1-9][0-9]\*)|([0-9]\*[1-9][0-9]\*\.[0-9]+)|([0-9]\*[1-9][0-9]\*)))$
浮点数:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d\*\.\d\*|0\.\d\*[1-9]\d\*|0?\.0+|0)$


二、校验字符的表达式


汉字:^[\u4e00-\u9fa5]{0,}$
英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
长度为3-20的所有字符:^.{3,20}$
由26个英文字母组成的字符串:^[A-Za-z]+$
由26个大写英文字母组成的字符串:^[A-Z]+$
由26个小写英文字母组成的字符串:^[a-z]+$
由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
由数字、26个英文字母或者下划线组成的字符串:^\w+$ 或 ^\w{3,20}$
中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
可以输入含有 ^%&',;=?$\" 等字符:[^%&',;=?$\x22]+
禁止输入含有~的字符:[^~\x22]+

三、特殊需求表达式

Email地址:^\w+([-+.]\w+)\*@\w+([-.]\w+)\*\.\w+([-.]\w+)\*$
域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
InternetURL:[a-zA-z]+://[^\s]\* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]\*)?$
手机号码:^1(3|4|5|6|7|8|9)\d{9}$
电话号码(“XXX-XXXXXXX”、“XXXX-XXXXXXXX”、“XXX-XXXXXXX”、“XXX-XXXXXXXX”、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
电话号码正则表达式(支持手机号码,3-4位区号,7-8位直播号码,1-4位分机号): ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
身份证号(15位、18位数字),最后一位是校验位,可能为数字或字符X:(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在 8-10 之间):^(?=.\*\d)(?=.\*[a-z])(?=.\*[A-Z])[a-zA-Z0-9]{8,10}$
强密码(必须包含大小写字母和数字的组合,可以使用特殊字符,长度在8-10之间):^(?=.\*\d)(?=.\*[a-z])(?=.\*[A-Z]).{8,10}$
日期格式:^\d{4}-\d{1,2}-\d{1,2}
一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
钱的输入格式:
有四种钱的表示形式我们可以接受:“10000.00” 和 “10,000.00”, 和没有 “分” 的 “10000” 和 “10,000”:^[1-9][0-9]\*$
这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式:^(0|[1-9][0-9]\*)$
一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号:^(0|-?[1-9][0-9]\*)$
这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧。下面我们要加的是说明可能的小数部分:^[0-9]+(.[0-9]+)?$
必须说明的是,小数点后面至少应该有1位数,所以"10.“是不通过的,但是 “10” 和 “10.2” 是通过的:^[0-9]+(.[0-9]{2})?$
这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样:^[0-9]+(.[0-9]{1,2})?$
这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样:^[0-9]{1,3}(,[0-9]{3})\*(.[0-9]{1,2})?$
1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须:^([0-9]+|[0-9]{1,3}(,[0-9]{3})\*)(.[0-9]{1,2})?$
备注:这就是最终结果了,别忘了”+“可以用”*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里
xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
中文字符的正则表达式:[\u4e00-\u9fa5]
双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
空白行的正则表达式:

\n\s\*\r

(可以用来删除空白行)
HTML标记的正则表达式:

<(\S\*?)[^>]\*>.\*?|<.\*? /> (
首尾空白字符的正则表达式:^\s\*|\s\*$或(^\s\*)|(\s\*$)
(可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)

腾讯QQ号:

[1-9][0-9]{4,} (腾讯QQ号从10000开始)

中国邮政编码:

[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)

IP地址:

((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))

<think>首先,用户的问题是:“我想查找项目中常用正则表达式匹配示例或规则 请问项目中常用正则表达式匹配示例”。这意味着用户想要知道在项目中常见的正则表达式匹配示例或规则。 我收到了系统级指令,必须遵守: - 所有行内数学表达式使用 `$...$` 格式。 - 独立公式使用 `$$...$$` 格式并单独成段。 - LaTeX语法正确。 - 使用中文回答。 - 生成相关问题。 - 回答中引用的段落末尾自然地添加引用标识。 此外,用户提到了参考站内引用,包括引用[1]、[2]、[3]、[4]和[5]。这些引用提供了有关正则表达式的信息: - 引用[1]:讨论数字匹配的正则表达式,如 `\d`、`\d+` 等。 - 引用[2]:提到匹配汉字的正则表达式。 - 引用[3]:关于Java中使用正则表达式。 - 引用[4]:讨论JavaScript中正则匹配失败的原因。 - 引用[5]:关于常用正则表达式集合。 用户说:“上述引用仅供参考,并不是用户真正的需求,请尽可能多的参考用户上一次的问题和你的回答。” 但查看对话历史,上一次消息是系统指令和用户的问题。在对话历史中,用户的第一条消息就是这个请求。所以,我需要基于当前问题和提供的引用来响应。 用户真正的需求是查找项目中常用正则表达式匹配示例或规则。因此,我的回答应该聚焦在提供常见的正则表达式示例,这些示例在项目开发中常用。 结构化回答: - **开头**:简要介绍正则表达式在项目中的应用,并根据引用内容自然地引用。 - **主体**:列出常见的正则表达式匹配示例,比如匹配数字、电子邮件、电话号码、URL、汉字等。确保使用中文解释。 - 由于有引用,我应该在相关部分添加引用标识。 - **结尾**:生成相关问题,以满足指令要求。 - **格式**:行内数学表达式如正则表达式模式应该用 `$...$` 格式,但正则表达式通常不是数学表达式,而是字符串模式。指令说“所有行内数学表达式(包括变量、不等式、方程等)必须使用$...$格式”,但正则表达式不是数学表达式;它更像代码。在示例中,系统指令使用了代码块(如Python代码),但没有提到正则表达式。为了安全起见,我应该将正则表达式模式作为代码或文本处理。指令指定数学表达式用 `$...$`,但正则表达式不是数学;它可能被视为文本模式。在用户提供的引用中,例如引用[1],使用了类似 `\d` 的格式,但没有LaTeX标记。我应该遵循指令:如果是数学表达式,用 `$...$`;但对于正则表达式,它可能更适合直接写或使用代码块。系统指令示例中没有正则表达式,但用户引用中使用了普通文本。我会假设正则表达式模式作为行内代码处理,但指令说“行内数学表达式”,而正则表达式不是数学。为避免混淆,我会在必要时使用 `$...$` 或直接写。在引用[1]中,它写为 `\d` 而没有特殊格式,但在LaTeX中,数学模式可能用于显示特殊字符。为了准确,我会将正则表达式模式写成行内代码或使用 `$...$` 如果它在数学上下文中。但在这里,最好使用反引号表示代码,如系统示例中的Python代码块。在系统指令示例中,代码块用于Python,所以我可以为代码使用代码块。 - 指令说:“独立公式必须使用$$...$$格式并单独成段”,但正则表达式通常不是公式。我会将正则表达式作为文本处理,必要时使用代码块。 - 确保回答使用中文。 常见正则表达式匹配示例: 1. **匹配数字**:如引用[1]提到的,`\d` 匹配单个数字,`\d+` 匹配一个或多个数字。 2. **匹配电子邮件地址**:常见如 `[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}`。 3. **匹配电话号码**:例如,`\(\d{3}\) \d{3}-\d{4}` 用于匹配格式如 (123) 456-7890。 4. **匹配URL**:如 `https?://[^\s/$.?#].[^\s]*`。 5. **匹配汉字**:如引用[2]提到的,Unicode范围用于汉字。 6. **其他常见**:如日期格式、IP地址等。 从引用中: - 引用[1]:专注于数字匹配。 - 引用[2]:汉字匹配。 - 引用[3]:Java中使用。 - 引用[4]:JavaScript中问题。 - 引用[5]:常用集合。 我会整合这些,并提供示例。 生成相关问题:在结尾添加相关问题,如指令示例那样。 回答结构: 1. 介绍:正则表达式在项目中的重要性。 2. 常见匹配示例列表:每个示例说明模式、用途,并添加引用标识如果需要。 3. 结论:总结。 4. 相关问题。 添加引用标识:基于用户提供的引用,但用户说“仅供参考”,所以我应该在相关内容处自然地添加。 例如: - 当讨论数字匹配时,添加 [^1]。 - 当讨论汉字匹配时,添加 [^2]。 - 等等。 最终,相关问题:生成3-5个相关问题。 </think>### 项目中常用正则表达式匹配示例 正则表达式是一种强大的工具,用于在各种项目中高效处理字符串匹配、验证和文本操作(如数据提取、输入验证等)。根据您提供的参考资料,我整理了一些项目中常见的正则表达式匹配示例和规则。这些示例涵盖了数字、电子邮件、日期、汉字等常见场景,并结合实际项目需求进行说明。每个示例都使用了标准正则表达式语法,并确保兼容主流编程语言(如 JavaScript、Python、Java 等)。如果您在实现时遇到问题,可以参考相关引用或调试工具(如在线正则测试器)。 以下是常见正则表达式匹配示例及其用途解释(模式使用 `$...$` 格式表示行内表达式,独立公式单独成段): #### 1. **匹配数字序列(如 ID、金额)** - **模式**:`$\d+$` 或 `$\d{n}$` - **用途**:在数据清洗或表单验证中,匹配连续数字(如订单号、金额)。例如: - `$\d+$` 匹配一个或多个数字(如 "123")。 - `$\d{6}$` 匹配恰好 6 位数字(如邮政编码)。这在引用[1]中强调了数字匹配的基本规则:`\d` 用于单个数字,`\d+` 用于多个数字[^1]。 - **应用场景**:用户输入验证(如手机号)、日志文件中提取数字 ID。 - **代码示例**(JavaScript): ```javascript const regex = /\d+/; console.log(regex.test("订单号: 1001")); // 输出: true,匹配到 "1001" ``` #### 2. **匹配电子邮件地址** - **模式**:`$[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$` - **用途**:用于注册表单或数据导入时验证邮箱格式。该模式确保用户名部分(如 "user.name")包含字母、数字、点或破折号,域名部分(如 "domain.com")以至少两个字母结尾。 - **应用场景**:用户注册系统、电子邮件营销工具。引用[4]指出,正则匹配失败的原因包括忘记设置全局标志或特殊字符处理不当,测试时需添加标志如 `g` 或 `i`[^4]。 - **代码示例**(Python): ```python import re pattern = r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}' result = re.findall(pattern, "联系 support@example.com 获取帮助") print(result) # 输出: ['support@example.com'] ``` #### 3. **匹配汉字(中文字符)** - **模式**:`$[\u4e00-\u9fa5]+$` - **用途**:在文本处理中提取或验证中文字符(如用户昵称、评论筛选)。该模式基于 Unicode 范围(4E00 到 9FA5),匹配一个或多个汉字。 - **应用场景**:多语言网站、中文内容分析。引用[2]详细说明了汉字匹配的正则表达式,适用于汉字字符的提取[^2]。 - **代码示例**(Java): ```java import java.util.regex.*; Pattern pattern = Pattern.compile("[\u4e00-\u9fa5]+"); Matcher matcher = pattern.matcher("Hello 世界!"); while (matcher.find()) { System.out.println(matcher.group()); // 输出: "世界" } ``` #### 4. **匹配日期格式(如 YYYY-MM-DD)** - **模式**:`$\d{4}-\d{2}-\d{2}$` - **用途**:在数据导入或日志解析中,验证标准日期格式。匹配类似 "2023-10-05" 的字符串。 - **应用场景**:数据库输入校验、报告生成。引用[5]中提到,正则表达式简化了模式匹配,比传统代码更高效[^5]。 - **代码示例**(任何语言通用): - 测试字符串:`2023-10-05`. - 匹配结果:整个字符串被匹配。 #### 5. **匹配 URL 链接** - **模式**:`$https?://[^\s/$.?#]+\.[^\s]*$` - **用途**:在网页爬虫或内容管理系统中,提取或验证 HTTP/HTTPS URL。匹配以 "http://" 或 "https://" 开头的基本链接。 - **应用场景**:网络爬虫、用户输入过滤。引用[4]分析了 URL 匹配失败的原因,如忽略全局标志或贪婪匹配问题,建议使用非贪婪限定符如 `?`[^4]。 - **代码示例**(Python): ```python import re url_pattern = r'https?://[^\s/$.?#]+\.[^\s]*' text = "访问 https://example.com/page" print(re.search(url_pattern, text).group()) # 输出: https://example.com/page ``` #### 6. **匹配电话号码(国际格式)** - **模式**:`$\+?\d{1,3}[-.\s]?\d{3,4}[-.\s]?\d{4}$` - **用途**:验证用户输入的手机或座机号,支持格式如 "+86 13812345678" 或 "020-12345678"。 - **应用场景**:CRM 系统、联系人表单。引用[1]的规则(如 `\d{n}`)可用于定制不同长度的号码[^1]。 - **代码示例**(JavaScript): ```javascript const phoneRegex = /\+?\d{1,3}[-.\s]?\d{3,4}[-.\s]?\d{4}/; console.log(phoneRegex.test("电话: +1 800-555-1234")); // 输出: true ``` #### 总结 正则表达式在项目开发中至关重要,能显著提升文本处理效率。以上示例覆盖了常见场景,但实际使用时需根据语言特性调整(如 JavaScript 中的 `RegExp` 对象或 Python 的 `re` 模块)。引用[3]强调,掌握基本语法和调试技巧(如使用 `Pattern` 和 `Matcher` 类)可以避免常见错误[^3]。如果您有特定需求或语言环境,可以通过在线工具(如 regex101.com)测试和优化模式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值