正则表达式的规范（笔记引自AI自动生成）

June-T

已于 2025-02-14 00:55:15 修改

阅读量1.5k

点赞数 25

文章标签：正则表达式笔记改行学it

于 2025-02-04 19:44:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_36771740/article/details/145443269

版权

正则表达式（Regular Expression）

正则表达式（简称 regex 或 regexp）是一种用于匹配和处理文本的强大工具。它通过定义特定的模式来描述字符串的结构，从而实现对文本的搜索、替换、提取等操作。

1. 基本字符

普通字符：字母、数字、空格等，直接匹配自身。
- 示例：a 匹配字符 a，1 匹配字符 1。
特殊字符：具有特殊意义的字符，需要用反斜杠 \ 转义。
- 示例：. 匹配任意字符，\. 匹配实际的句点 .。

2. 元字符

元字符是正则表达式中具有特殊功能的字符，常见的元字符包括：

元字符	描述
`.`	匹配除换行符（`\n`）以外的任意单个字符。
`^`	匹配字符串的开头。
`$`	匹配字符串的结尾。
`\`	转义字符，用于匹配特殊字符本身（如 `\.` 匹配 `.`）。
`\|`	逻辑“或”，匹配左边或右边的表达式。
`()`	分组，将多个字符作为一个整体处理，或捕获匹配的内容。
`[]`	字符集合，匹配括号内的任意一个字符。
`{}`	量词，指定前面字符或分组的重复次数。

3. 字符集合

[abc]：匹配 a、b 或 c 中的任意一个字符。
[^abc]：匹配除 a、b、c 以外的任意字符。
[a-z]：匹配任意小写字母。
[A-Z]：匹配任意大写字母。
[0-9]：匹配任意数字。
\d：匹配任意数字，等价于 [0-9]。
\D：匹配任意非数字字符。
\w：匹配任意字母、数字或下划线，等价于 [a-zA-Z0-9_]。
\W：匹配任意非字母、数字或下划线的字符。
\s：匹配任意空白字符（空格、制表符、换行符等）。
\S：匹配任意非空白字符。

4. 量词

量词用于指定前面字符或分组的重复次数：

量词	描述
`*`	匹配前面的字符 0 次或多次。
`+`	匹配前面的字符 1 次或多次。
`?`	匹配前面的字符 0 次或 1 次。
`{n}`	匹配前面的字符恰好 n 次。
`{n,}`	匹配前面的字符至少 n 次。
`{n,m}`	匹配前面的字符至少 n 次，至多 m 次。

5. 分组和捕获

()：将多个字符作为一个整体处理，并捕获匹配的内容。
- 示例：(abc)+ 匹配 abc、abcabc 等。
(?:)：非捕获分组，只分组不捕获。
- 示例：(?:abc)+ 匹配 abc、abcabc，但不捕获内容。
\n：引用分组捕获的内容，n 是分组的序号（从 1 开始）。
- 示例：(a)\1 匹配 aa。

6. 边界匹配

^：匹配字符串的开头。
- 示例：^abc 匹配以 abc 开头的字符串。
$：匹配字符串的结尾。
- 示例：abc$ 匹配以 abc 结尾的字符串。
\b：匹配单词边界。
- 示例：\bword\b 匹配独立的单词 word。
\B：匹配非单词边界。

7. 零宽断言

零宽断言用于指定匹配位置，但不消耗字符：

断言	描述
`(?=...)`	正向肯定预查，匹配后面满足条件的位置。
`(?!...)`	正向否定预查，匹配后面不满足条件的位置。
`(?<=...)`	反向肯定预查，匹配前面满足条件的位置。
`(?<!...)`	反向否定预查，匹配前面不满足条件的位置。

8. 模式修饰符

模式修饰符用于改变正则表达式的匹配行为：

修饰符	描述
`i`	忽略大小写。
`g`	全局匹配（匹配所有符合条件的字符串，而不仅仅是第一个）。
`m`	多行模式，使 `^` 和 `$` 匹配每行的开头和结尾。
`s`	单行模式，使 `.` 匹配包括换行符在内的所有字符。

9. 常用正则表达式示例

匹配邮箱地址：

 [a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

匹配 URL：

https?://[^\s]+

匹配手机号码：

1[3-9]\d{9}

匹配日期（YYYY-MM-DD）：

\d{4}-\d{2}-\d{2}

匹配 IP 地址：

(\d{1,3}\.){3}\d{1,3}

10. 正则表达式的应用场景

文本搜索：在文件中查找符合特定模式的字符串。
数据验证：验证用户输入是否符合格式要求（如邮箱、电话号码等）。
文本替换：将符合模式的字符串替换为指定内容。
数据提取：从文本中提取特定格式的数据（如日期、URL 等）。

正则表达式是一种非常强大的工具，掌握它可以极大地提高文本处理的效率！
以上内容仅是个人学习用笔记，由DeepseeAI生成。

博客等级

码龄9年

17
原创

147
点赞

125
收藏

57
粉丝

关注

私信

热门文章

上一篇：: 第六讲：函数递归

下一篇：: Linux系统root密码遗忘解决方案

最新评论

第五讲：（二）static和extern
优快云-Ada助手: 恭喜作者撰写第10篇博客！标题中的“第五讲：（二）static和extern”引起了我的兴趣。你在静态和外部变量方面的讲解肯定给读者带来了很多收获。不过，我也想提供一些建议，希望对你的下一步创作有所帮助。首先，我建议你在博客中尽量提供更多的实例和案例，这样读者可以更好地理解static和extern的概念和用法。此外，你可以考虑添加一些相关的代码片段，以便读者能够更好地将理论应用到实际编程中。另外，如果可能的话，你可以在博客中引用一些权威的参考资料或者其他博客文章，这样读者可以进一步深入学习相关主题。最后，我想再次祝贺你的持续创作，并期待你未来更多精彩的博客文章。谢谢你的分享！
第五讲：（一）C中的函数
优快云-Ada助手: 恭喜您写完了第9篇博客！标题“第五讲：C中的函数”听起来很有意思，我想这篇博客一定会对读者们的学习很有帮助。希望您能继续保持创作的热情，分享更多关于C语言的知识。对于下一步的创作建议，或许您可以考虑深入探讨C语言中函数的高级应用，或者分享一些实际案例，让读者更好地理解函数的实际应用场景。期待您的下一篇博客！
第三讲：（二）循环结构和goto语句
优快云-Ada助手: 恭喜博主写完了第7篇博客！标题看起来非常有趣，循环结构是编程中非常重要的一个概念。循环结构的灵活运用可以让程序更高效地执行，我期待能够从博文中学到更多关于循环结构的知识。希望博主在以后的创作中继续保持，也期待能够看到更多关于其他编程概念的分享，比如条件语句或函数的应用。感谢博主的付出，期待更多精彩的博文！
第三讲：（二）循环结构和goto语句
2301_80455133: 就整个人生来讲，快乐比成功重要多了
C语言中的短路求值介绍
优快云-Ada助手: 恭喜您写了第6篇博客！标题“C语言中的短路求值介绍”非常引人注目。文章内容也很有深度，阐述了短路求值在C语言中的应用。您对这个主题的理解和解释很清晰，让读者们更容易理解这个概念。在下一步的创作中，我建议您可以继续探索相关的C语言特性或者深入研究其他编程语言中的求值机制。这将为读者们提供更多有关编程的知识，并帮助他们更好地理解和应用这些概念。谦虚的态度是成长的关键，希望您继续保持并在后续的文章中展现更多精彩内容。期待您的下一篇作品！

大家在看

基于 GQA 与 MoE 的古诗词生成模型优化 llm项目以及对应八股 1975

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。